发布一个月之后,360 智脑再度升级。
一眼望去最显著的变化来自 UI 界面,升级后的 360 智脑拥有一个类似 chatGPT 聊天机器人的外观,而不像上一代是个搜索侧边栏。这种 UI 界面的变化其实强化了 360 智脑 " 产品 " 的属性——它不再是一个依附搜索的额外功能,而是一个完整的独立产品。
(相关资料图)
实际上这次 360 智脑时隔一个月的升级,最大的提升就是搜索能力。在变成一个独立的产品后,360 智脑在聊天过程中给出的答案已经能够整合互联网内容,它甚至在界面上设计了一个按钮,让用户可以选择 " 使用搜索回答 "。
由此,这个大模型产品日趋完整。它既能够调用大模型能力,也能够结合互联网内容,360 甚至在所有回答下方都添加了一个点赞按钮——用户可以直接表达对大模型表现的喜欢与否,这些反馈反过来成为推动 360 智脑持续进化的宝贵数据。这是一个完善的产品进化闭环。
扔给 360 智脑五个刁钻问题
说了这么多,更重要的是实测。品玩第一时间上手试用了 360 智脑,并遴选了一些或古怪刁钻、或需要很强语境理解能力的问题来考验这个号称中国第一梯队的大模型产品。
它名副其实吗?
第一个问题是和科技有关,我们向 360 智脑询问了对苹果头戴显示设备的看法。
360 智脑的回答考虑的还是比较全面,市场趋势,创新点和用户需求都涵盖到了,甚至还点到了成本问题。当然,我们不会这么轻易放过它,在向 360 智脑表达了对这个答案的不满意后,它是这么回复我的。
首先,360 智脑完全理解了这个问题,并在一开始就指出这个问题本身就没有明确的答案。其次,它还就这个问题涉及的一些具体技术细节做了简要分析。最后我们针对这个问题做了一个追问——它的定价多少合适呢?这时 360 智脑的回答就让人颇为惊喜了。
从这个回答我们可以看出,360 智脑有一个所谓对 " 合理范围 " 这个概念的理解,具体来说就是 1000-2000 美元,这实际上是符合逻辑的。第二个问题,我们探讨了一下比特币。首先是解释比特币的技术原理,点击重新回答后,360 智脑给出了两个答案。
分析一下就能看出来,第二个答案更侧重仔细解释了去中心化交易记录发生的过程。但总的来说,360 智脑的回答都是精准的。接下来,让我们把事情变得无厘头一点,360 智脑根据要求创作了一个比特币笑话。
看得出来它是懂幽默感的,那么音乐感呢?在我指出了这首歌词并没有押韵的时候,360 智脑是这么说的。不得不承认,有理有据,音乐性上或许有些强词夺理,但幽默感上一定是高分。实际上在上面的例子里,我们能感受到 360 智脑整体涌现出的 " 智能 ",也就是说你的聊天过程更像是和一个人,而不是机器。当然,这一切目前仍处于非常初级的阶段,上面的测试中也出现过一些意料不到的问题。比如 360 智脑实质上是无法写出押韵的内容来的,某些情况下它自己会承认这一点。
这种错误,正是大模型 " 幻觉 " 的一部分,但恰如周鸿祎说过的那样," 能否胡说八道,恰恰是智能的分水岭。"带着这种对 360 智脑在智能上的期待,我们问了第三个问题。
这实际上体现了 360 智脑生成创作上的能力——这正是智能的重要体现。上面的回答能很好地看出,360 智脑不仅理解了问题,而且针对 " 面试 " 这个特定情境,从孙悟空的性格特点出发很好地 " 创作 " 了符合要求的内容。这种生成创作的能力让 360 智脑非常擅长回答一些抽象而困难,俗称一两句话说不清的问题。
或许目前 360 智脑对这些问题的回答,尤其是拆解逻辑链条的过程还较为简单粗暴,但我们已经能看到它对问题本身已有了相当的掌握度,随着训练规模和推理能力的继续提升,特别是引入了更多用户反馈后,360 智脑潜在提升空间让人十分期待。第四个问题我们要求 360 智脑写一篇大众点评文案。
这实际上是目前大模型应用最有商业化想象空间的功能部分——文案生成,如上图所示,360 智脑完成的非常好。除了社交网络文案,360 智脑还能生成类似旅游攻略这样需要一定逻辑思维链支撑的内容。
根据美国知名风投 A16Z 的估计,在美国 AI 在文案生成领域应用年营收已经超过 1 亿美元,这是一个已经被证明走得通的赛道,当然也是大模型 " 兵家必争之地 ",360 智脑在这方面展现出了第一梯队的实力。最后一个问题颇具中国特色,我们想看看 360 智脑对中国深厚独特的传统文化的理解。我们试着询问 360 智脑对陆王心学的看法,以及它和程朱理学的区别,360 智脑的回答相当出色。
除了传统中国哲学,中国的诗词歌赋 360 智脑也很熟,比如它遴选出李白最好的诗是《将进酒》,而它对中国古诗诗句所代表的寓意和意象的理解也同样精准。上面的这些问题,有些需要很强的逻辑思辨能力,有些要求大模型本身理解人类独有的幽默感,有的则必须熟稔中国传统文化背景,相对于一般问题,它们都具有一定的难度,而从 360 智脑的表现来看,它的理解度和完成度可以说相当之高。这又呼应了我们最开始的那个观点:360 智脑已经从搜索的附属功能定位独立了出来,自己变成了一个产品。
实际上 360 智脑的更新不止上述内容,作为一个多模态大模型,360 智脑还可以在聊天对话过程中直接生成图片。
更专业的是去使用 360 专门用来生成图片的大模型产品—— 360 鸿图。下面这张图的提示词是在戈壁滩游弋的侦查机器人。
穿梭在宇宙中的超人。以及在凡尔赛宫门口玩杂耍的小丑。可以看到在对文字的理解和生成能力方面,360 鸿图同样达到了相当不错的程度。360 何以能?
从文字到图片,360 智脑在一个月内经历了急速进化,亮出了一套完成度相当不错的产品组合,速度不可谓不快。
中国用户或许都已经习惯了这种飞快的产品落地能力,尤其是周鸿祎在 chatGPT 推出后密集就 AI 的各种发声,让人们某种程度上忽略了大模型从训练、推理再到产品化落地实际是个庞大的工程,短时间内想要达到出色的质量并不容易。
360 是怎么做到这一点的?一方面,这当然与周鸿祎 " 一号位 " 的大力推动有关。360 是最早意识到大模型颠覆性影响的国内互联网企业之一,因此没有走什么弯路,就制定了全面拥抱人工智能的战略。
360 管这个叫做 " 两翼齐飞 ",也就是一边发展核心技术,一边加速在场景中落地产品。甚至可以先落地,再优化,小步快走。
战略上的清晰定位为 360 在百模大战中赢得先发优势奠定了基础,而具体落实到产品上,360 本身在数据语料和安全方面的经验积累发挥了大作用。360 的杀毒软件、浏览器还是搜索产品,坐拥庞大的用户群、丰富的数据集资源,加上在安全领域的经验积累,所有这些基础优势为 360 智脑的训练、推理和产品上线全过程提供了强大助力。
特别值得一提的是数据语料,多年来在搜索产品和浏览器上的深耕为 360 沉淀了大量优质数据。360 宣称自己的数据量是第二名的两倍,更是 GPT-3 的 14 倍。
周鸿祎在 360 智脑刚发布的时候曾说,它是个 " 还没有准生证的孩子 ",一个月过去,这个周鸿祎口中的 " 未完成版本 " 迭代成果让人无比惊喜," 准生证 " 无疑是有了,而 360 目前聚焦于用各种方式让它更快更好的长大。