假如存在这样一位助手,它能够理解并处理长达 200 万字的文本,精准解读 500 多个网页的内容,而且在短短几个月内就吸引了超过 2004 万的日活用户。从 20 万字到 200 万字的巨大飞跃,从普通搜索到 AI 自主深度推理,Kimi 正在以令人惊叹的速度不断进化。它不仅仅是一个强大的语言模型,更是一个具备思考、推理和自我反思能力的智能体。
- 公司背景
- 成立时间:2023 年 3 月
- 核心团队:曾参与 Google Gemini、Google Bard、盘古 NLP、悟道等大模型研发
- 融资情况:已完成超过 25 亿元融资,估值达到 33 亿美元
- 产品功能
- 长文本处理能力:Kimi 支持长达 20 万汉字的输入和输出,之后提升至 200 万字,在处理长篇文献、报告、合同等方面表现出色。
- 多语言对话:擅长中文和英文的对话,能满足用户各种语言需求。
- 文件处理能力:支持多种文件格式如 PDF、Word、Excel、PPT 和 TXT 文件的解析。
- 搜索能力:具备联网搜索能力,可结合最新搜索结果提供回答。
- 深度推理功能:正在开发深度推理功能,将允许 Kimi 解决复杂问题,进行自我反思和多级分解问题。
- 技术优势
- 长文本处理:在市场中因长文本处理能力占据优势。
- AI 自主搜索:Kimi 探索版的搜索量是普通版的 10 倍,可以精读超过 500 个页面,答案更全面准确。
- 深度推理:通过模拟人类推理思考过程,能处理更复杂的查询。
- 用户定位
- 涵盖学术科研人员、互联网从业者、程序员、自媒体与内容创作者、法律从业人员等。用户普遍认为 Kimi 在信息搜集、资料整理、内容创作、编程辅助等方面提供了极大便利。
- 市场地位
- 在 AI 助手市场中占有重要地位,特别是长文本处理和搜索能力方面。
- 更新记录
- 2023 年 10 月 9 日:Kimi Chat 首次亮相,支持 20 万汉字输入。
- 2023 年 11 月 16 日:Kimi Chat 面向全社会开放服务。
- 2023 年 11 月:发布 V1.1 版本,解决模型在复杂场景下输出重复等问题,提升回复速度,解决移动端网络不稳定问题。
- 2023 年 12 月 26 日:发布 V1.2 版本,提升首字回复速度,增强扫描件识别能力。
- 2024 年 1 月 26 日:发布 V1.3 版本,基础模型能力全面升级,联网搜索能力、上下文学习能力、文学创作能力、语言翻译能力等得到增强。
- 2024 年 3 月 18 日:宣布支持 200 万字无损输入,并启动内测。
- 2024 年 4 月 18 日:发布最新版本,提升模型能力,支持 Kimi 常用语,新增语音输入 / 播报功能,并支持搜索引用溯源。
- 2024 年 7 月 1 日:官宣开放平台上下文缓存功能开启公测,可降低最高 90% 的长文本旗舰大模型使用成本,并提升模型响应速度。
- 2024 年 7 月 8 日:上线浏览器插件,提供点问笔和总结器两个功能。
- 2024 年 10 月:发布 Kimi 探索版,具备 AI 自主搜索能力,搜索量是普通版的 10 倍,一次搜索即可精读 500 个页面。
- 2024 年 3 月访问量暴增
- 根据腾讯新闻报道,Kimi 在 2024 年 3 月的访问量暴增至 1219 万,较 2 月增长了 317%。这得益于长文本处理技术的突破,从 20 万字提升至 200 万字的处理能力,有效解决了用户的信息整合问题,在信息整理领域迅速占据领先地位,吸引大量用户关注和使用。
- Kimi 概念股影响股市
- Kimi Chat 的爆火对股市产生显著影响,带动相关概念股大幅上涨,如华策影视、掌阅科技、九安医疗等公司市值在短短几个交易日内大涨近 100 亿元。申万宏源研报称 Kimi 已确认为爆款,国内语言大模型正式达到 GPT - 4 水平。
- Kimi 的用户量增长
- 截止 2024 年 3 月 25 日,Kimi 的网页端、APP 端的用户 DAU(日活跃用户数量)突破历史新高,分别达到了 79 万和 54 万。叠加小程序用户量,全端总 DAU 显著大于 225 万,可能已超越百度的文心一言的 233 万。
- 月之暗面完成新一轮融资
- 2024 年 5 月 21 日,月之暗面进行新一轮融资,最新一轮估值报价或达 30 亿美金,新入局投资者包括腾讯、高榕创投等。此前已完成总额超过 30 亿元的融资,最新估值已超过 33 亿美元。
- Kimi 探索版的发布
- 2024 年 10 月 11 日,月之暗面正式发布 Kimi 探索版,具备 AI 自主搜索能力,可以模拟人类的推理思考过程,多级分解复杂问题,并即时反思改进结果,提供更全面、更准确的答案。其搜索量是普通版的 10 倍,一次搜索即可精读超过 500 个被研究的页面。
与国内类似的 AI 平台相比,Kimi 在以下方面占据优势:
- 长文本处理能力:支持长达 20 万汉字的超长文本输入和输出,在国内 AI 平台中突出,能满足文件阅读、内容创作和深度对话等对长文本处理的需求。
- 文件和网页解析:具备文件和网页的解析功能,能阅读和理解各种格式文件以及网页内容,为用户提供精准信息和回答。
- 多语言对话:支持中文和英文对话,能理解和回应用户各种语言需求,适用于不同语言环境下的搜索和交流。
- 搜索能力:拥有强大的搜索能力,结合搜索结果提供更准确、全面的回答,Kimi 探索版的 AI 自主搜索能力更强,搜索量是普通版的 10 倍,能一次搜索精读超过 500 个页面。
- 深度推理功能:正在进行深度推理功能的内测,通过更复杂的算法和模型提高对上下文的理解能力,未来能进行更深入的对话,理解意图并提供相应建议。
- 用户体验:在提供详尽回答的同时注重用户体验,如引用文章发布时间覆盖广泛,助用户全面了解主题。
- 成本易用性:目前对用户免费,用户可无成本尝试和使用各项功能,而文心一言需月费或年费。
- 网页端使用
- 微信小程序
- 在微信平台搜索使用 Kimi 的小程序,方便快捷。
- 移动端应用
- 提供 iOS 和 Android 平台的移动应用,用户在应用平台搜索下载后,可在手机或平板等移动设备上安装使用。
- 浏览器插件
- 安装浏览器插件后,可在浏览网页时直接使用 Kimi 的功能,如高亮选取文字内容进行搜索、解析图片或视频里的文字等。
- 开放平台 API
- 多语言对话能力
- 擅长中文和英文对话,能理解和回应各种语言需求。例如,作为科技类自媒体作者,阅读英文文献遇到生僻术语,可发给 Kimi,几秒内得到通俗易懂的中文解释,节省查资料时间。
- 长文本处理能力
- 可对超长文档、多个文件快速摘要、翻译、答疑,支持上传多种文件格式和图片,支持长达 20 万字的输入和输出,适合长文本写作、翻译和代码编写等任务。如解读《遥远的救世主》中 “救世主” 的概念,通过对小说不同层面的分析,给出多层次的解读。
- 文件处理能力
- 能阅读和解析多种格式文件,如解析一张图片的数学问题内容,通过拉格朗日乘数法等方法找到答案并条理输出。
- 搜索能力
- 具备搜索能力,能结合搜索结果提供更准确、全面的回答。如搜索 Kimi 的相关信息,阅读多个网页后给出相关介绍。
- Kimi + 功能
- 允许用户根据特定需求自定义 Kimi 模型,输入 “@” 符号召出特定的 Kimi + 进行交互,有办公提效、辅助写作、社交娱乐、生活实用等多种应用场景。
- 语音输入与输出
- Kimi 智能助手 App 支持语音输入和输出功能,底部按住可直接语音输入,打开右上角语音播报功能可自动播报内容。
- 常用语功能
- 相当于快捷键,让 Kimi 记住提示词,通过几个词唤醒。可将经常发给 Kimi 的内容设为常用语,方便快捷调用相关功能。
- 深度推理 AI 搜索(Kimi 探索版)
- 能理解复杂问题,拆解成子问题,通过逐步推理找到答案,搜索量是普通版的 10 倍。如设计营养均衡的晚餐食谱,根据人数、地域背景和口味偏好等信息,通过推理设计出包括前菜、主菜、配菜、酒水等的食谱,并提供食材、做法、营养和热量信息。
- 思维链 CoT
- 在解决问题时展示思考过程,用户能看到答案的推导路径。如对 Kimi 的介绍,先搜索相关信息,再分析整合给出介绍。
- 数学和编程支持
- 运用数学模型和编写代码来处理和分析数据,执行复杂计算。如写一个生成指定目录结构和全部文件名的程序,给出 Python 代码示例。
- 自我反思能力
- 在给出答案后,能够自我评估,发现不足时重新搜索和推理以提供更好的答案。如回答关于生成指定目录结构和文件名的程序问题后,可根据用户需求进一步优化。
- 图像识别专家
- 上传包含文字信息的图片,能够完美解读图片中的内容,如解读关于如何阅读一本书的图片内容,并整理输出为 Markdown 格式。
- 浏览器插件
- 浏览器插件支持在网页内划线提问和全文摘要,提升阅读效率。
- PPT 助手
- 联合 AiPPT,一键生成 PPT,提供 PPT 大纲生成和模板选择。如根据手机推荐内容生成 PPT。
- 长文生成器
- 利用长文生成器智能体,可以生成万字长文。如写一篇关于如何破除心理焦虑的文章,给出从理解焦虑本质到寻求专业帮助等多方面的内容。
- 图表生成
- 使用 Mermaid 画流程图,支持多种类型的图表,如甘特图、饼图、思维导图等。如用横向的 Mermaid 图表解释第一性原理。
- 学术科研人员
- 适用长文本处理、联网搜索、文件处理、辅助创作、专业解读文件等功能。
- 互联网从业者
- 适用联网搜索、资料整理、辅助创作、文件处理等功能。
- 程序员
- 适用编程助手、文件处理、辅助创作、资料整理等功能。
- 自媒体与内容创作者
- 适用辅助创作、资料整理、联网搜索、文件处理等功能。
- 法律从业人员
- 适用专业解读文件、资料整理、辅助创作、联网搜索等功能。
- 开放平台 API
- 提供开放平台,支持灵活的 API 调用,多种编程语言的 SDK,方便开发者对接。
- 浏览器插件
- 合作伙伴平台
- 与一些平台和应用建立合作关系,如与AiPPT合作实现 PPT 自动化生成。
- 开发工具集成
- API 设计兼容 OpenAI,方便项目切换和集成。
- 第三方客户端
- 存在一些第三方客户端支持与 Kimi 大模型对话功能对接。
- 社交媒体和内容平台
- 可能通过 API 或合作方式,让用户在这些平台上使用功能。
- 企业级应用
- 提供企业级应用的 API 服务,企业可集成到业务流程和应用中。
- 技术创新与升级:用户期待 Kimi 在 AI 技术上持续创新,提供更智能、更个性化的服务,如通过自主学习优化回答准确性和相关性。
- 处理能力提升:鉴于长文本处理能力,希望在处理大规模数据和复杂文件方面能力进一步提升,满足更多专业领域需求。
- 更多语言支持:部分用户希望支持更多语言,使更广泛用户群体受益。
- 更广泛的应用场景:期待应用于更多样化的场景,如教育、医疗、金融等专业领域,解决具体问题。
- 更好的用户体验:希望界面和交互设计更直观易用,提供更稳定高效的服务。
- 隐私和安全性:因处理大量个人信息,期望确保交互数据安全。
- 更丰富的功能:一些用户希望提供更多功能,如自动文档摘要、语言翻译、编程辅助等。
- 合理的定价策略:对于未来付费功能或会员服务,希望有合理定价并提供足够价值。
- 多平台兼容性:希望更好地兼容不同操作系统和设备。
- 社区和支持:建立活跃用户社区,交流心得,期待团队提供及时有效技术支持。
Kimi 智能助手凭借其长文本处理能力、深度推理与自主搜索技术迅速崛起,在学术研究、编程开发、内容创作等领域已成为得力助手。展望未来,Kimi 将不断创新和技术升级,开拓更多应用领域,推动人与技术的深度融合。