据介绍,知乎通过联合研发与战略投资的方式与国内顶尖大模型团队面壁智能达成深度合作,共同开发中文大模型产品并推进应用落地。周源表示:“知乎以应用层和数据层的独特优势,将致力为中文互联网的大语言模型添砖加瓦,成为新生产力的开发者,为中国在 AI 时代贡献力量”。
目前,知乎和面壁智能合作开发的“知海图AI”中文大模型,已经运用进了知乎热榜,知乎首个大模型功能“热榜摘要”上线并开启内测,利用语言理解能力对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户。
在随后的群访环节,周源向媒体解释了知乎利用大模型首先推出“热榜摘要”这一功能背后的思考:“所有的公司都应该首先想自己给用户提供的价值是什么,能做的东西应该在这个基础上跟社会有一个交集。知乎本身是一个场景,经过多轮产品升级、用户使用,我们可以理解它是在不断地通过用户使用得到验证的场景,场景其实是代表用户的需求,它最核心的其实是讨论,大家通过讨论交换信息、分享自己的知识经验见解,这是我们一直以来所做的事。讨论最后会形成一些大家比较熟悉的功能,ChatGPT就是,由讨论产生,最后又聚集在某个地方,有更多用户查看它,我们在这个基础上也看到,当然AI确实可以在这个场景(热榜摘要)、这个功能里提升用户的体验。
【资料图】
其实10年前,知乎其实有一个产品功能叫‘回答总结’,开放给所有用户,大家进行编辑,把大家所有的回答做总结,后来发现这个事情太困难了,回答数量多了以后成本非常高,而且效果并不好。我们非常好地看到了,现在可以通过技术的方式,帮人完成这件事情,你要加入一个讨论,逮着离得最近的一个人,大概可以告诉你这个讨论是关于什么的,你迅速知道一个梗概,再阅读里面有价值的内容。”
面壁智能联合创始人、CTO 曾国洋在大会演讲中表示,“经过测试,在知乎热榜的应用场景下,知乎与面壁合作自研的大模型与GPT-4相比达到了持平的效果”。未来,知乎还将拓展更多AI大模型的应用场景,为创作者赋能。
李大海在大会上介绍,经过评估,面壁智能最新的CPM-Bee模型是视野范围内表现最好的中文大语言模型,其创始团队成员全部来自清华大学计算机自然语言处理与社会人文计算实验室(清华大学NLP实验室),在这个领域有很深的积累。“知乎与面壁智能在交流中发现彼此的产品观和价值观都很匹配,我们对面壁进行了投资,并且展开了深入的模型共建过程”,李大海表示。
2023年,随着ChatGPT出圈,AI 2.0成为大众关注的重点,AI辅助加盟内容平台成为普遍趋势。来自于清华大学NLP实验室的面壁智能团队与知乎有着很深的渊源,曾国洋是知乎机器学习领域的优秀答主,与知乎在 2018 年就曾有过学术上的合作。
曾国洋表示,知乎拥有非常专业的技术团队,对新技术非常敏锐,也是国内最早看到大模型技术的重要性的公司之一。知乎和面壁智能的合作首先集中在更强的中文大模型上,在 CPM-Bee基础上,新的模型有了更强的逻辑推理能力和更快的训练和推理速度,并逐步应用在知乎更多应用场景中。
早在2020年底面壁智能团队就发布了首个中文大语言模型 CPM-1,之后又陆续发布了 CPM-2、CPM-3 和 CPM-Ant 等模型。而知乎早在五年前就提出了智能社区的概念,把 AI 技术应用在了社区的内容生产、流通、治理和消费等环节。这些经由真实“讨论场”检验过的技术与模型,是构建AI应用场景和专用数据的信息流来源。
知乎拥有中文互联网大量高质量内容,这正是其研发大语言模型的优势所在。在周源看来,在目前的 AI 研究中,AI 的生产力要素可以分为三层,从上到下依次是应用场景、专有数据、基础模型。知乎基于问答的“讨论场”是与此契合的天然应用场景;而不断增长的内容、关系和知识图谱则是独一无二的专有数据;以GPT为代表的基础模型层在快速发展,性能表现越来越好,成本快速下降。
未来,“知海图AI”的能力将逐步应用在对创作的赋能、对讨论场的赋能和对信息获取的赋能。“AI 是人类能力的扩增,也会让知乎社区变得更加精彩”,周源表示。
除了首个大模型功能“热榜摘要”外,李大海还提及基于大语言模型的AI 2.0新技术对知乎社区用户的三个赋能:第一个是生产力的提升,对创作者的赋能,通过给创作者提供各种智能工具,希望提升他们的创作质量和创作效率,从而提高生产力;第二个是场景的优化,对讨论场的赋能,包括摘要功能、首答功能等,希望整体提升讨论场的讨论氛围和讨论质量;第三个是工具的升级,对信息获取的赋能,针对刷知乎和搜知乎的用户,计划利用大模型把知乎的搜索跟推荐两个产品变得更聪明,从而让用户在使用搜索推荐的时候能够更快、更准地找到想要的内容。”(多知网哆啦)