百度发布文心一言AI模型,称中文理解能力超越其他任何模型_李彦宏_进行_训练

3月16日,百度在北京总部召开发布会,正式推出大语言模型文心一言(ERNIE Bot)。据百度创始人、董事长兼CEO李彦宏介绍,文心一言具备人类在自然语言上的理解、表达、逻辑推理等多方面的能力,并称其在中文理解方面可以说是“超过了世上任何一

3月16日,百度在北京总部召开发布会,正式推出大语言模型文心一言(ERNIE Bot)。据百度创始人、董事长兼CEO李彦宏介绍,文心一言具备人类在自然语言上的理解、表达、逻辑推理等多方面的能力,并称其在中文理解方面可以说是“超过了世上任何一个大模型”。

在现场Demo演示中,文心一言除了能进行文字交流,也可以根据输入文字输出相应的语音、图像、视频。不过,由于算力成本的问题,当前文心一言还并不会对全部用户开放。

···

续写三体、还可输出图像和音视频

现场展示的文心一言的UI较之ChatGPT较为相似,界面左侧有“新建对话”按钮,此后每次生成的对话也会自上而下排列显示在左侧。主要界面则为一个对话框,用以和AI进行不断对话。

而具体在文学创作、商业文案创作、数理逻辑推断、中文理解、多模态生成等几方面,现场也分别给出了提前录制的Demo视频。比如,在被问到小说《三体》可以从哪些角度出发进行续写时,文心一言给出了它的回答:

1.角色塑造:可以更深入地描绘主要角色的性格、背景和经历,使他们更加真实可信。

2.情节设计:可以设计更多的情节和转折点,增强故事的紧张感和悬念。

3.文化背景:可以探索不同的文化和社会背景,增加故事的深度和广度。

4.哲学思考:可以探讨更深层次的哲学问题,如生命的意义、人类与宇宙的关系等。

而在继续追问“如何从哲学角度进行续写”时,文心一言也给出了回答:可以从生命的意义、人类与宇宙的关系、道德和伦理、价值和信仰、科技与人文的关系等五大方向进行续写。

之后,文心一言也完成了为科技公司起名、解答鸡兔同笼问题、解释洛阳纸贵的典故并写出藏头诗等任务。值得注意的是,在最后的“多模态生成”方面,文心一言在进行交流时,能随时针对输入的文字返回相应的图像、语音和视频。

在现场的演示视频中,文心一言能够根据要求创作一张“2023世界智能交通大会的海报”。

同时,也能生成方言口音的语音,还能根据生成内容制作并返回相应视频。李彦宏现场介绍表示,除了现场演示的四川话,广东话、东北话、闽南语也都能讲。

···

当前模型仍“训练不充分”

在介绍文心一言背后的技术原理时,百度首席技术官王海峰提到,当前模型仍“训练不充分”。事实上,此前业界有观点认为“现在所有大语言模型都是训练不充分(undertrained)的”,也就是说,由于现有的大模型参数量级动辄上亿,已经很难有充足的优质数据来供给模型训练。

而根据李彦宏介绍,文心一言所用的训练数据主要来自于千亿万亿量级的网络页面、几十亿的(百度)搜索请求、巨量图片,以及5500亿条知识图谱(一种结构化的语义知识库)中的事实数据。因此,他认为,百度在面对当前语言大模型经常会出现的“一本正经地胡说八道”的问题时“拥有优势”,可以事先检查生成的内容到底是否和事实吻合,一定程度上保证了回答的准确性。

李彦宏提到,文心一言经历了一个从“判别式研发”到“生成式研发”的过程。现在走上了一条大算力、大模型、大数据的“暴力美学”之路。虽然模型当前还会出现明显的错误,但已经开始让其去适配百度内外部各种各样的产品。

而在谈到当前大热的生成式AI时,李彦宏认为,这代表了一个新的技术范式。比如,未来云计算公司主要的商业模式会变成MaaS,也就是Model and Service(大模型与服务)。

“以后的应用会建立在大模型上,而非过去的云计算的算力或存储上。以前大家看基础云服务,会看算力,看存储,现在就会看你的模型好不好,框架好不好。这对于云计算产业是一个根源性的,改变游戏规则的情况。”李彦宏表示。

采写:南都记者杨博雯

本文来自投稿,不代表长河网立场,转载请注明出处: http://www.changhe99.com/a/jnd7b55vwJ.html

(0)

相关推荐