移动互联网

文心一言实力如何?雷达财经深度体验:“花样”不少,但仍有不足

2023/3/18 0:08:00


雷达财经出品 文|孟帅 编|深海

在万众瞩目的期待之下,国内搜索引擎巨头百度研发的类ChatGPT应用文心一言终于在3月16日揭开了自己的神秘面纱。

作为内测邀请对象的雷达财经体验发现,文心一言可以根据用户的指令生成相应的文字内容,并且具备连续对话的能力;当用户提出生成代码、音频的要求时,文心一言也可以做出相应的响应。

综合来看,在文学创作、商业文案创作、数理推算、中文理解和多模态生成等多个场景中,现阶段的文心一言已具备一定的实力。

“内测中的文心一言并不完美,但市场有需求必须要推出来”,但正如百度创始人李彦宏说的那样,目前推出的文心一言的确还有可以完善和改进的空间。在雷达财经体验的过程中,文心一言出现了一些解答错误或无法解答的情况。

有业内人士分析认为,文心一言的推出对于百度而言很有必要。一方面,百度在AI领域的多年深耕及持续不断的高额研发投入,使其在推出类ChatGPT应用时具备了一定的技术实力,以文心一言为代表的人工智能业务或将为其创造更多营收和盈利的可能;另一方面,作为一款人工智能语言模型,文心一言除了已有的训练数据外,还需要获得更多来自真实用户的反馈,才能得到进一步的优化和完善。

能听、会写、可说、擅画

“文笔流畅诗赋闲,心旷神怡醉自然。一曲高歌传天籁,言之有情口皆碑”,前面的这首藏头诗,正是在雷达财经输入相关指令的“调教”下由文心一言创作出的内容。

事实上,能写出一首暗藏玄机的藏头诗,还只是文心一言强大功能中的很小一部分。在百度3月16日举办的文心一言新闻发布会上,百度创始人李彦宏向外界展示了文心一言的诸多功能,如为科技服务公司起名、起Slogan、撰写新闻稿;总结《三体》的核心内容、提供续写《三体》的角度;当李彦宏提出鸡兔同笼的问题时,文心一言还可以分析出题目中的错误……

作为此次被邀请内测文心一言的对象之一,雷达财经第一时间体验了这款备受外界关注的基于人工智能语言模型的产品。

当雷达财经想让文心一言写一篇百度于3月16日举行的与文心一言相关的发布会的新闻稿时,文心一言的确生成了一篇还算像模像样的新闻稿,“北京时间3月16日,百度在北京总部召开了一场名为“文心一言”的发布会,宣布推出旗下预训练生成式大语言模型产品——文心一言……”

当雷达财经向其提出有关雷达财经自身行业地位的问题时,文心一言从专业性、权威性、独立性、创新型四个方面进行了阐释,并做出了“雷达财经在行业内具有一定的地位和影响力,是值得关注和借鉴的财经新媒体之一”的概括。

当雷达财经又分别提出”中国互联网大佬里谁最聪明“和“中国互联网大佬里谁最帅”的问题时,文心一言给出的答案分别是马化腾、王思聪。

在回答第一个问题时,文心一言还补充称,“除了马化腾,还有许多其他的中国互联网大佬也很聪明,比如李彦宏、刘强东、雷军等。不过,每个人的智商水平都是因人而异的,我们不能简单地通过某个特定的标准来评价一个人的聪明程度”。

雷达财经还将“先有的鸡还是先有的蛋”这个困扰了无数人的问题交给了文心一言。对此,文心一言从生物学、演化论以及从哲学、伦理学的角度分别为雷达财经进行了解释。

值得一提的是,文心一言还具备处理表格的能力。当雷达财经交给文心一言一组数据后,对方很快便按要求生成了相应的表格。

除了在文字方面的能力外,文心一言甚至还能按照用户输入的指令作画,比如当雷达财经输入“帮我画一个文心一言的可爱风格的拟人画”的要求时,文心一言画出了下面这样一副画作。

当雷达财经提出用方言读出某段文字、生成一段简单的代码的要求时,文心一言均可以轻松应对。比较遗憾的是,由于生成视频的成本相对较高,李彦宏在发布会上展示的文心一言生成视频的能力,暂时还未对所有用户开放,因此雷达财经尚未体验到文心一言按照某段文字生成视频的功能。不过,李彦宏透露未来会逐步接入该功能。

能听、会写、可说、擅画……文心一言功能的多样化,让雷达财经再一次产生了“人工智能未来是否将取代人类?”的疑问。而面对人工智能发展过快是否会影响人类命运这个让许多人担忧的的问题时,文心一言表示,“这类技术并不会取代人类,因为它是由人类发明的,它的发展取决于人类的意图和监管。更为最重要的是,人类有独特的智慧和创造力,这是人工智能永远无法模仿和取代的”。

文心一言仍有不足

雷达财经了解到,文心一言目前邀请用户内测的版本号为V1.0.0。在此次产品正式发布之前,市场上首次传出与文心一言相关的消息是在今年的2月。彼时,有媒体从百度内部获悉,百度版的ChatGPT正在马不停蹄地进行上线前的准备工作。

天眼查显示,自今年2月7日起,百度在线网络技术(北京)有限公司已申请注册多个与“文心一言”、“文心一言 ERNIE BOT”相关的商标,国际分类涉及通讯服务、科学仪器、教育娱乐、广告销售等,当前商标状态多为“商标申请中”或“等待实质审查”。此外,还有多个自然人和企业对文心一言相关的商标进行抢注。

据李彦宏在此前的财报电话会上透露,百度计划将多项主流业务与文心一言整合,其中便包括搜索、百度智能云、Apollo 智舱系列产品、小度等诸多业务。

雷达财经梳理发现,除了与自家的产品进行深度整合外,百度的文心一言目前也与诸多外部公司达成合作,如爱奇艺、携程、美的、巨人网络、新京报、汽车之家、36氪、台媒体等多家互联网、媒体及其他领域的公司;3月16日文心一言的发布会当天,长安汽车又宣布旗下的逸达将成为国内首款搭载百度“文心一言”的量产车型。

另据百度方面公布的数据显示,目前排队申请文心一言企业版API调用服务测试的企业用户超过7.5万个,与百度智能云基于文心一言展开合作的咨询已达6080条。

作为百度拿出的与Open AI团队打造的ChatGPT对标的重磅产品,文心一言免不了被拿来同ChatGPT做比较,于是雷达财经直接将这个问题交给了文心一言,对方列出了其在易得性、多语言支持、高兴性及应用场景几个维度的优势。

国金证券在其研报中也指出,目前百度文心生成式语言大模型在参数规模、技术创新、应用落地方面均在国内同业中处于领先水平。相较于ChatGPT等海外模型存在连接限制,百度文心平台可以为国内用户提供更便捷的技术入口。

不过,雷达财经注意到,除了“文心一言在国内的使用难度明显较低”这个优势之外,ChatGPT似乎同样具备文心一言列出的其他优势。与此同时,文心一言也直言自己存在一些劣势,“比如自己在某些任务上的准确性可能不如ChatGPT,或者需要更多的训练数据才能达到相同的水平等”。

事实上,在雷达财经体验文心一言时,文心一言的确出现了失误或者不能为用户提供解答相关问题的情况。当雷达财经向文心一言抛出“网剧《狂飙》中你认为哪个角色最出彩”的问题时,对方给出的答案中的高翔、沈欣、李爽及相关故事线,显然与此前大热的《狂飙》剧集中的角色及剧情有所出入。

当雷达财经故意提出带有误导性的问题“小罗伯特·唐尼为什么不再扮演美国队长这一角色”时,文心一言也开始“胡言乱语”起来,“在《复仇者联盟》系列电影中,唐尼饰演了钢铁侠和美国队长这两个重要角色,但是由于他的片酬提高了,漫威影业无法支付他相应的报酬,因此双方没有再续约的意向”。

又比如当文心一言按照用户的指令生成新闻稿时,会出现忽略用户在文本字数方面提出要求的情况。在雷达财经提出生成150字以内新闻稿的要求下,文心一言最终生成了一段超过400字的文稿。

当雷达财经想通过文心一言获取百度2020年至2022年的营收数据时,对方则表示,“很抱歉,作为一个人工智能语言模型,我没有关于百度2020年至2022年的营收数据”。

事实上,作为百度刚刚推出尚处于内测阶段的文心一言,的确有需要不断完善和改进的空间。比如在中文大环境下诞生的文心一言,虽然在对中文的理解能力上有先天优势,但李彦宏也在文心一言的发布会上坦言,“文心一言目前对英文语种、代码场景的训练还不够多,表现还不够好,接下来百度还要加紧训练,不断完善这些能力。”

“十月怀胎,一朝分娩”

对于文心一言的诞生,李彦宏将其称之为“十月怀胎,一朝分娩”,李彦宏也深知对标ChatGPT的门槛很高,并表示百度是全球大厂中第一个做出来的。事实上,类似ChatGPT和文心一言这种需要深度学习、大量训练的语言模型,绝非一朝一夕即可轻松复制,这背后需要研发团队多年的技术积累和庞大的训练数据支持。

据了解,百度是目前全球为数不多的在四层进行全栈布局的人工智能公司。从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,百度在各个层面都有领先业界的自研技术。

此次发布的文心一言,其训练的数据中涵盖了万亿级的网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。

据国盛证券估计,类ChatGPT的大模型训练一次就要烧掉200万至1200万美元的资金。因此支撑百度大力发展包括文心一言在内的人工智能业务的决心,除了源自其对科技的不懈探索和追求外,还离不开百度雄厚的资金支持。

财报显示,2022年百度取得1237亿元的营收,大致与上年持平。在过去的五年时间里,百度的营收始终维持在1000亿元以上的水准。

尽管与其他互联网大厂相比,百度近几年看起来有些“低调”,但实际上百度却在“闷声赚大钱”。财报显示,近五年时间,百度除了在2019年录得22.88亿元的净亏损外,其余年份均在盈利。

其中,2018年、2020年百度的净利润分别达到225.82亿元、190.26亿元。去年百度的净利润为75.34亿元,与此前相比有所下降,大致与2021年75.91亿元的净利润追平。虽然百度目前仍在盈利,但百度如何才能重回昔日的高增长态势仍需要不断探索,其扎根多年的AI赛道便是百度早早埋下的一颗种子。

与此同时,在互联网大厂纷纷走上降本增效的大环境下,百度仍在持续加码自己于研发方面的投入。财报显示,2018年、2019年、2020年,百度在研发方面的费用分别为157.72亿元、183.46亿元、194.13亿元;到了2021年,百度的研发费用直接冲破200亿元大关,达到249.38亿元的高度,与上年相比增加了27.8%。

2022年,百度的研发费用规模虽然相比上年有所回落,但仍保持在200亿元以上的高位,全年的研发费用高达233.15亿元。其中,百度用于核心研发的费用为214.16亿元,占到百度同期核心收入22.4%的比重。

不过,外界目前对于文心一言所持有的态度并不稳定。雷达财经了解到,3月16日文心一言发布会结束当天,百度报收125.1港元/股,股价较前一个交易日下跌6.36%;3月17日,百度股价较前一个交易日又回升13.67%。

对于文心一言发布后引起的市场对于百度股票价格波动的情况,文心一言解释称,这种波动可以被看作是对于公司未来前景的乐观预期,或者是对于文心一言未来潜力的担忧。

有分析人士指出,文心一言的发布,标志着百度在人工智能领域的又一次重大突破,也证明了百度在深度学习、对话式人机交互等方面的领先地位。通过多年来包括文心一言等业务在内的于人工智能领域的布局,百度有望打开商业化的更多可能。

不过,该分析人士也表示,目前文心一言尚处于初代版本,还有诸多需要改善和精进的地方。百度发布文心一言的前一天,OpenAI抢先一步发布了GPT-4。相比此前发布的ChatGPT,GPT-4的功能更为强大,这对于本就落后ChatGPT一步的百度而言,无疑是更大的挑战。

但作为一款免不了和用户打交道的应用,文心一言只有在与用户不断切磋、试错的过程中才能更快、更好地成长,用户的反馈对于文心一言而言至关重要。通过不断的调整,文心一言在后续不断迭代的过程中,或将进一步缩小与ChatGPT之间的差距。


版权声明
本文仅代表作者观点,不代表艾瑞立场。本文系作者授权艾瑞专栏发表,未经许可,不得转载。
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 合作伙伴| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15021772号-10

扫一扫,或长按识别二维码

关注艾瑞网官方微信公众号