近日,月之暗面官宣上线Kimi浏览器插件,官方介绍称,该插件支持轻量搜索功能,适用于浏览网页术语查询、报道文章摘要总结、写作灵感提供、文档数据查询等应用场景。插件目前功能较少,但都为大模型常用场景,包括“点文笔”和“总结器”两项功能。那么kimi与豆包的浏览器插件功能上线后到底谁更胜一筹,通过这篇文章作者带大家一探究竟。
一、插件是什么?
相较于传统的应用开发流程,插件无需开发一整套完整系统,通过接口就能提供服务,且易于修改和更新。在某种意义上,插件是AI应用创新的最佳载体。
二、豆包与Kimi的特点与差异化
通过安装教程知道豆包与Kimi的浏览器插件都是crx文件直接拖动至chrom即可安装成功。
豆包与Kimi自己回答本身的插件功能如下
1. 豆包
2. Kimi
多语言对话能力:能够流畅地进行中文和英文对话。长文本处理:支持最多20万字的输入和输出,可以处理长文本写作、翻译、代码编写等任务。文件阅读和解析:能够阅读和解析TXT、PDF、Word文档、PPT幻灯片、Excel电子表格等格式的文件。网页内容解析:当用户发送网页链接时,我会先解析网页内容,然后结合解析内容回答用户问题。搜索能力:结合搜索结果为用户提供更全面的回答。角色扮演:根据用户要求,可以进行角色扮演对话。代码输出:对于代码相关问题,我会提供完整的可执行代码。文档和文件生成:虽然不能直接创建文件,但可以提供文字回复帮助用户解决问题。付费打赏支持:用户可以通过网页端付费打赏支持Kimi。Kimi+功能:允许用户根据特定需求自定义Kimi模型。网页和App使用引导:提供Kimi智能助手的网页和App下载链接。语音输入输出支持:最新版Kimi智能助手App支持语音输入和输出。
从豆包和kimi的大模型插件回答中,可以看出豆包回答的实际功能还是比较准确的,kimi回答的12个功能中,其中有5条是不符合浏览器插件功能的只有通过访问官网才会有,从语意理解上豆包的回答会更准确一些。
基于插件功能的基础上我们接下来进行几个维度的体验分析
3、基础功能拆解
对豆包与kimi的浏览器插件基础功能进行拆解
经过基础的功能拆解后通过对比,豆包的基础能力要比kimi丰富很多,在插件的展示逻辑上豆包只能通过侧边栏进行辅助工作,kimi可以通过快捷键进行全局悬浮,从交互体验上kimi在处理基础文本工作上体验会更友好一些。
豆包大模型浏览器插件如下图,基础功能上支持图像生成;AI搜索;翻译等,这一点要远比kimi支持的业务场景更多元,在交互体验与更多功能中,豆包支持划词工具栏简化与技能库,这是Kimi不具备的,技能库这一功能可以重点展开讲一下,对于小红书创作的博主与代码极客来说实在是太爽了,可以无缝衔接通过悬浮窗进行文案修改与代码纠错,这两点在后续的业务场景中会详细展开来说。
三、适用的业务场景
结合白领工作模拟3类业务大模型推理场景,分析豆包与kimi的推理能力
1. 竞品分析
TOB产品经理在日常工作中需要经常对于竞品网站的业务逻辑与覆盖板块进行逻辑梳理与分析,下面以用友、泛微、携程商旅三个TOB网站为测试样本测试Kimi与豆包大模型插件的逻辑推理能力。
kimi与豆包表现:
观点1:通过3个TOB的高级网站业务框架分析kimi与豆包的推理能力,从token的推理数量与网站逻辑分析上来看kimi 与豆包打平,但是kimi可以用【回车】按钮直接进行全文总结推理,交互上kimi更胜一筹。
2. 简历分析
在文件处理工作中LLM模型应用最为广泛以简历附件处理为背景测试kimi与豆包的大模型插件在浏览器中的实用性,当在chrom浏览器中打开一份简历附件时,kimi与豆包的插件悬浮按钮是不支持弹出的,需要手动打开插件侧边栏进行辅助工作,但这一功能只有豆包有效,Kimi是无效的。
在浏览器侧边栏跟豆包进行交互时,逻辑却不是耦合的在pdf文件上进行划词时,无法激活豆包的划词技能库,只有在侧边栏单独进行附件传输与问答时才有作用。
观点2:在关联固定浏览器打开的pdf文件时,Kimi还需进行适配激活优化,豆包需要进行耦合逻辑与激活划词技能库优化
3. 文案创作与文章阅读
当日常我们在阅读公众号文章或小红书博主在进行文案脚本创作时,kimi与豆包的大模型插件可以在浏览器中帮助进行大幅提效;
当选取的文字没有上下文做支撑时,Kimi 需要在文本框输入文字搜索;而豆包得益于更好的 UI 界面,直接点击搜索便在侧边栏得到详尽答案。
当有足够的上下文支撑时,Kimi 表现亮眼,不仅能给出细致解释,也能结合上下文进一步帮助用户理解词汇和文章。
对于一篇题为“股权融资活动与欧洲价值增长回报”的英文文章,豆包能够正确总结网站并给予 6 个点的亮点提炼;Kimi 插件也能准确总结文章,并对关键段落进行总结提炼亮点,且能够对数据、重要定义以及关键行为进行解释,其总结更加全面并且深入。
豆包得益于更好的 UI 界面与划词技能库,这一点对于新媒体作者的灵感非常有帮助,以小红书脚本为例豆包插件可以直接通过划词技能库直接生成小红书文案。
观点3:在辅助阅读时,Kimi插件不仅总结内容,还能对数据、重要定义以及关键行为进行解释,增加总结的深度且全局悬浮的交互效果好大幅提高文章阅读效率;豆包的UI界面和划词技能库设计对新媒体作者特别有用,内容创作方面的实用性上更胜一筹。
四、当下与未来的生态扩展思考
1. 当下问题优化
1)提升交互体验
即时反馈:进一步优化Kimi的即时反馈机制,如通过语音或更直观的界面提示,增强用户的交互体验多模态交互:探索将视觉、触觉等多模态交互方式融入插件,提升用户体验。
2)增强文件处理能力
跨平台适配:加强Kimi和豆包在不同操作系统和浏览器中的文件处理能力,确保其在各种环境下的稳定性和兼容性。智能预处理:开发智能预处理功能,自动调整文件格式和内容,以适应不同的阅读和分析需求。
3)深化内容理解与创作辅助
深度学习与自然语言处理:利用深度学习技术提升对数据、定义和行为的理解和解释能力,使总结更加精准和深入。创意生成工具:为豆包开发更高级的创意生成工具,帮助新媒体作者在内容创作中实现更多创新和个性化表达。
2. 未来生态扩展
当前豆包与kimi只是开发了适配于浏览器的插件进行工作提效,想要获得的更大的市场份额和利益生态扩展是必然;
但是在当前大模型市场与互联网行业的软件生态的存量市场竞争中,市场份额很高的现象级软件,不论是TOB/TOC领域都已巨头林立;
豆包背靠母公司字节在抖音,西瓜视频,今日头条,激萌等一众APP产品线的扶持下市场份额不必有太多担心,在APP工厂下自然会有C端来不断的补齐研发成本,拉高ROI;
但是对于kimi这种创业团队来说想要与巨头已经完成闭环的生态中竞争,进行产业融合的落地是唯一的不二选择
例如:
教育与研究场景:将大模型插件应用于教育和研究领域,辅助学术研究和知识传播。企业解决方案场景:开发面向企业的定制化解决方案,帮助企业在数据分析、市场研究等方面提升效率。数据安全:加强数据加密和隐私保护措施,确保用户在使用插件时的数据安全。合规性:确保插件符合各国的数据保护法规,增强用户对产品的信任。
但是只卷TOB/TOG领域对于科技产业资本来讲市场还是小的,而且抗周期与抗风险性较差,还需要与数10亿的C端消费者共享企业利润才可以达成完美的闭环;
例如最近爆火的萝卜快跑,科技是服务于人民的;人工智能更多的应用场景值得科技资本进一步的探索。
专栏作家
小于爱学习,公众号:产品技术加油站,人人都是产品经理专栏作家。左手科技互联网&右手产业与经济,长期关注硬科技和产业经济学。
本文原创发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于CC0协议。