当前位置:首页 > 文学 > 正文

暴增614%!DeepSeek,传出大消息!

  • 文学
  • 2025-02-07 11:36:03
  • 1

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

暴增614%!DeepSeek,传出大消息!

  AI竞赛加速!

  根据网站跟踪公司SimilarWeb的数据,在短短一周内,DeepSeek网站的用户数量就超过了谷歌的Gemini聊天AI,后者已经存在了近两年。DeepSeek.com上周二的访问量达到了创纪录的4900万次,比前一周增长了614%。

  不过,AI领域的竞争依然非常激烈。中国AI初创公司DeepSeek的爆火,正在推动海外AI(人工智能)巨头加速上新。

  当地时间2月5日,谷歌旗下AI大模型Gemini系列全面上新,包括正式版Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及新一代旗舰大模型Gemini 2.0 Pro实验版,并在Gemini App中推出了其推理模型Gemini 2.0 Flash Thinking实验版,作为对近期走红的推理模型DeepSeek-R1和OpenAI旗下模型o3-mini的回应。

  另外,2月7日,OpenAI公司在X平台发布推文,宣布面向免费和付费用户更新o3-mini的思维链,并为付费用户更新o3-mini-high的思维链,更透明、更详细地展示模型的“推理”步骤以及得出答案的方式。

  来看详细报道!

  DeepSeek超越谷歌Gemini

  在成功亮相仅两个月后,中国AI初创公司DeepSeek一飞冲天,成为全球第二大最受欢迎的AI聊天机器人。

  据The Information报道,网站跟踪公司SimilarWeb估计,上周,在短短一周时间内,DeepSeek网站的用户数量就超过了谷歌的Gemini聊天AI。

  SimilarWeb数据显示,1月31日,DeepSeek.com在美国的日访问量为240万次,比Gemini网站(150万次)高出60%。OpenAI的ChatGPT仍然是DeepSeek的8倍,当天的日访问量为1930万次。此前1月28日,DeepSeek在美国的访问量达到490万次的峰值。

  DeepSeek和Gemini之间的差距在美国以外更大。SimilarWeb数据显示,1月31日,这个中国聊天AI在全球(基本不包括中国)的访问量为2920万次,是 Gemini的三倍多。

  SimilarWeb数据显示,上周二(1月28日),DeepSeek.com的访问量达到了创纪录的4900万次,比前一周增长了614%。虽然这个数字不包括基于应用程序的流量,但它凸显了DeepSeek的快速增长。一个月前,该网站的平均每日访问量为30万次,但到1月27日,这一数字激增至3340万次,震撼了美国科技股。

  据报道,DeepSeek成功的主要驱动力是开放式V3模型的推出,该模型吸引了全球开发人员和公司的关注。V3的训练成本为550万美元,明显低于美国类似解决方案的成本。同时,它的能力与ChatGPT的功能相当,但有一个重要的区别:该模型可以免费下载并在本地服务器上运行。这使得它对希望采用AI技术而不必依赖云服务的组织具有吸引力。

  DeepSeek公司成立于2023年7月,是一家致力于实现通用人工智能(AGI)的创新型科技公司。2024年12月,DeepSeek-V3发布,性能对齐海外领军闭源模型。据官方技术论文披露,V3模型的总训练成本为557.6万美元,对比GPT-4o等模型的训练成本约为1亿美元。

  2025年1月,DeepSeek-R1发布,性能对标OpenAI-o1正式版。在数学、代码、自然语言推理等任务上,性能比肩OpenAI-o1正式版。2月1日消息, DeepSeek的人工智能助手在140个市场下载次数最多的移动应用程序排行榜上名列前茅。国外大型科技公司如微软、英伟达、亚马逊等已先后上线部署支持用户访问DeepSeek-R1模型。

  招商证券指出,DeepSeek-V3奠定模型高效训练基础,R1通过大规模强化学习使开源模型推理能力追平o1。开源模型直接带来AI 产业模型能力普遍提升,同时低廉的使用成本搭配卓越的性能倒逼OpenAI降低GPT使用成本、加速模型迭代,促进产业生态繁荣。大模型能力普遍提升首先利好AI 应用开发,尤其小模型易于在端侧落地,长期看DeepSeek 带来的应是算力层面的杰文斯悖论,整体AI 应用生态繁荣应将带来推理算力的更大需求。

  OpenAI、Google应对竞争

  当地时间2月2日,OpenAI发布了一款名为“深层研究”(deep research)的功能,并上传了演示视频。这项代理功能使用推理综合大量线上信息,并为用户完成多步骤研究任务。简单来说,就是“深层研究”可以从互联网上收集信息,并将其合成为简明的报告。

  它将由OpenAI o3的一个版本提供支持,该模型针对网页浏览和数据分析进行了优化,可利用推理来搜索、解释和分析网上大量文本、图像和PDF,并根据信息做出必要的调整。OpenAI声称,deep research“只需数十分钟就能完成人类需要数小时才能完成的工作。”其首席产品官Kevin Weil也提到,它完成的任务对人类来说可能需要30分钟到30天不等。

  另外,2月7日,OpenAI公司在X平台发布推文,宣布面向免费和付费用户更新o3-mini的思维链,并为付费用户更新o3-mini-high的思维链,更透明、更详细地展示模型的“推理”步骤以及得出答案的方式。

  像o3-mini这样的推理模型会在输出结果前进行彻底的事实核查,这有助于它们避免一些通常会困扰模型的陷阱,但推理模型需要更长时间才能得出解决方案。

  OpenAI公司表示已经找到了一种平衡,让o3-mini可以“自由思考”,然后将其“想法”组织成详细的摘要,接下来通过额外的后处理步骤,审查原始思维链,删除任何不安全的内容,并简化任何复杂的思想,后续处理步骤还支持非英语用户以其母语接收思维链,从而创造更易于访问和友好的体验。

  另据多家媒体2月6日消息,OpenAI、软银和甲骨文的合资企业“星际之门”接近在美国得州为更多数据中心园区选定地点,并着眼于其他十几个州的更多项目。OpenAI首席全球事务官Chris Lehane当天在电话会议上表示:“随着有关DeepSeek的消息传出,这表明这是一场非常真实的竞争,而利害关系再大不过了。无论谁在这场竞争中胜出,都将真正塑造未来世界的模样。”

  在AI领域,科技巨头谷歌也有大动作。据澎湃新闻消息,当地时间2月5日,谷歌旗下AI大模型Gemini系列全面上新,包括正式版Gemini 2.0 Flash、Gemini 2.0 Flash-Lite以及新一代旗舰大模型Gemini 2.0 Pro实验版,并在Gemini App中推出了其推理模型Gemini 2.0 Flash Thinking实验版,作为对近期走红的推理模型DeepSeek-R1和OpenAI旗下模型o3-mini的回应。

  据介绍,性能强劲的Gemini 2.0 Pro实验版在编码等复杂任务上表现突出,拥有200万tokens的超长上下文窗口,可以编写完整的代码并包括所有正确的数据结构和搜索算法,使用数据结构的准确性很高。在通用、代码、推理、多模态、数学、长文本、图像、音视频等13项测试中,Gemini 2.0 Pro实验版在Gemini大家庭里拿下了11个第一名。目前,Gemini Advanced的订阅用户已经可以在App上试用2.0 Pro。

  另一边,作为主力模型的Gemini 2.0 Flash在2024年的谷歌开发者大会上初次亮相,现在已经被集成到谷歌的AI产品中并开放API。该模型适用于大规模、高频率的任务,能够处理多达100万tokens的上下文窗口,拥有强大的多模态推理能力。Gemini 2.0 Flash支持多模态输入和文本单模态输出,在未来几个月内将提供多模态Live API。

  同样是在2月5日,在谷歌Gemini模型上新的几小时后,OpenAI宣布ChatGPT Search向所有人开放,无需注册。目前,就同谷歌搜索一样,来到OpenAI官网首页就可以直接使用搜索功能。这对于谷歌而言无疑是一次巨大的冲击,不少网友调侃道“谷歌再见”,也有网友表示“感恩DeepSeek”。

  责编:罗晓霞

  校对:赵燕

有话要说...