DeepSeek 崛起引发美国巨头恐慌
DeepSeek 近期受到来自美国 IP 地址的大规模 DDoS 攻击,导致其线上服务受到影响。奇安信、360 等网络安全公司表示,监测发现 DeepSeek 近期一直遭受大量海外攻击,1月27日起手段升级,除了 DDoS 攻击,还包括大量的密码爆破攻击。DeepSeek 的 AI 服务和数据正面临前所未有的安全考验。DeepSeek 第一时间进行了响应和处理,并暂时限制了+86手机号以外的注册方式。
另有消息显示,Gemini 1206 已封禁中文输出,对中文提问和回答全面拒绝。Poe 平台也限制了 DeepSeek R1 模型的访问,并以更高价格提供服务,宣称与 Fireworks 和 Togethers(美国 AI 公司)合作,确保数据存储在美国。这两家服务商的 API 价格分别为 7 美元和 8 美元,是 DeepSeek 官方 API 价格的数十倍。这些举动被广泛解读为美国企业试图通过技术封锁和商业限制等不正当手段削弱 DeepSeek 在全球市场的竞争力。
#DeepSeek #Gemini #美国 #人工智能 #不正当竞争 #DDoS
DeepSeek 近期受到来自美国 IP 地址的大规模 DDoS 攻击,导致其线上服务受到影响。奇安信、360 等网络安全公司表示,监测发现 DeepSeek 近期一直遭受大量海外攻击,1月27日起手段升级,除了 DDoS 攻击,还包括大量的密码爆破攻击。DeepSeek 的 AI 服务和数据正面临前所未有的安全考验。DeepSeek 第一时间进行了响应和处理,并暂时限制了+86手机号以外的注册方式。
另有消息显示,Gemini 1206 已封禁中文输出,对中文提问和回答全面拒绝。Poe 平台也限制了 DeepSeek R1 模型的访问,并以更高价格提供服务,宣称与 Fireworks 和 Togethers(美国 AI 公司)合作,确保数据存储在美国。这两家服务商的 API 价格分别为 7 美元和 8 美元,是 DeepSeek 官方 API 价格的数十倍。这些举动被广泛解读为美国企业试图通过技术封锁和商业限制等不正当手段削弱 DeepSeek 在全球市场的竞争力。
#DeepSeek #Gemini #美国 #人工智能 #不正当竞争 #DDoS
杜洛夫庆祝农历新年并谈中国在人工智能领域崛起背后教育模式的竞争力
杜洛夫在其频道中发布文章庆祝中国新年(Chinese New Year),并以中国AI初创公司DeepSeek的成功为例,讨论了中国在人工智能领域的快速进步。他指出,这一成就并非偶然,而是长期以来中国学生在数学和编程国际奥林匹克竞赛中表现优异的结果。中国的中学教育体系借鉴了苏联模式,以激烈竞争为核心,能够培养出众多顶尖人才。
相比之下,西方教育体系往往避免竞争,禁止公开学生成绩和排名,以减少学生压力。然而,这种做法也削弱了优秀学生的动力,使他们对学术失去兴趣,转而投向电子游戏等更具竞争性的领域。杜洛夫认为,现实世界的竞争无处不在,无论是体育、商业还是科技,排名和优胜劣汰都是真实存在的。他以AI行业的基准测试为例,强调DeepSeek的优越性,并预测如果美国的中学教育体系不进行根本性改革,中国在科技领域的主导地位将变得不可避免。
#杜洛夫 #教育 #人工智能 #中国
杜洛夫在其频道中发布文章庆祝中国新年(Chinese New Year),并以中国AI初创公司DeepSeek的成功为例,讨论了中国在人工智能领域的快速进步。他指出,这一成就并非偶然,而是长期以来中国学生在数学和编程国际奥林匹克竞赛中表现优异的结果。中国的中学教育体系借鉴了苏联模式,以激烈竞争为核心,能够培养出众多顶尖人才。
相比之下,西方教育体系往往避免竞争,禁止公开学生成绩和排名,以减少学生压力。然而,这种做法也削弱了优秀学生的动力,使他们对学术失去兴趣,转而投向电子游戏等更具竞争性的领域。杜洛夫认为,现实世界的竞争无处不在,无论是体育、商业还是科技,排名和优胜劣汰都是真实存在的。他以AI行业的基准测试为例,强调DeepSeek的优越性,并预测如果美国的中学教育体系不进行根本性改革,中国在科技领域的主导地位将变得不可避免。
#杜洛夫 #教育 #人工智能 #中国
阿里发布超大规模MoE模型Qwen 2.5-Max
1月29日凌晨,阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型。该模型预训练数据超过20万亿 tokens。目前开发者可在 Qwen Chat 平台免费体验模型,企业和机构也可通过阿里云百炼平台直接调用新模型 API 服务。
在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中,Qwen2.5-Max 表现超越了 DeepSeek V3,同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。阿里云的基座模型在大多数基准测试中都展现出了显著的优势。阿里云称随着后训练技术的进步,下一个版本 Qwen2.5-Max 将会达到更高水平。
#通义千问 #Qwen #阿里 #人工智能
1月29日凌晨,阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型。该模型预训练数据超过20万亿 tokens。目前开发者可在 Qwen Chat 平台免费体验模型,企业和机构也可通过阿里云百炼平台直接调用新模型 API 服务。
在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中,Qwen2.5-Max 表现超越了 DeepSeek V3,同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。阿里云的基座模型在大多数基准测试中都展现出了显著的优势。阿里云称随着后训练技术的进步,下一个版本 Qwen2.5-Max 将会达到更高水平。
#通义千问 #Qwen #阿里 #人工智能
白宫评估DeepSeek对国家安全影响
当地时间1月28日,白宫新闻秘书卡罗琳·莱维特表示,美国正在评估中国人工智能应用DeepSeek对国家安全的潜在风险,特别是涉及知识产权盗窃的可能性。白宫人工智能事务负责人大卫·萨克斯提到,DeepSeek可能通过“蒸馏”技术进行数据窃取。美国国家安全委员会目前正在进行审查,关注该技术可能对美国人工智能产业的影响。
然而,“蒸馏”是AI领域合法且广泛应用的优化技术,旨在缩小模型规模并提升效率。技术论文显示,DeepSeek蒸馏小模型主要基于开源模型(如Qwen、Llama系列)优化,而非直接使用OpenAI的专有数据。DeepSeek发布同时就开源了自身模型及并为公众蒸馏了六个小模型,技术透明,回馈社区,与“窃取”指控形成鲜明对比。
美国政界过去曾多次将中国商品、文化产品甚至日常用品与国家安全挂钩,如大蒜、龙虾、筷子、方便面、豆浆、泡菜、辣条、红枣、奶茶、火锅、煎饼果子、智能冰箱、电热水壶、电风扇、吸尘器、电蚊拍、电饭煲、彩色打印机、激光扫描仪、电动滑板车、电动自行车、电动公交车、太阳能电池板、路由器、平板电视、无人机、起重机、熊猫、熊猫玩偶、围棋、魔方、积木、拼图、陀螺、风筝、太极拳、功夫电影、皮影戏、汉字、剪纸、对联、广场舞、电影、瓷器、草帽、水稻种子、雨伞、快递箱、钢琴、灯泡、玻璃杯、口罩、丝袜、各种情趣玩具等。此次对DeepSeek的质疑延续了这一争议性趋势。
#美国 #人工智能 #安全 #DeepSeek
当地时间1月28日,白宫新闻秘书卡罗琳·莱维特表示,美国正在评估中国人工智能应用DeepSeek对国家安全的潜在风险,特别是涉及知识产权盗窃的可能性。白宫人工智能事务负责人大卫·萨克斯提到,DeepSeek可能通过“蒸馏”技术进行数据窃取。美国国家安全委员会目前正在进行审查,关注该技术可能对美国人工智能产业的影响。
然而,“蒸馏”是AI领域合法且广泛应用的优化技术,旨在缩小模型规模并提升效率。技术论文显示,DeepSeek蒸馏小模型主要基于开源模型(如Qwen、Llama系列)优化,而非直接使用OpenAI的专有数据。DeepSeek发布同时就开源了自身模型及并为公众蒸馏了六个小模型,技术透明,回馈社区,与“窃取”指控形成鲜明对比。
美国政界过去曾多次将中国商品、文化产品甚至日常用品与国家安全挂钩,如大蒜、龙虾、筷子、方便面、豆浆、泡菜、辣条、红枣、奶茶、火锅、煎饼果子、智能冰箱、电热水壶、电风扇、吸尘器、电蚊拍、电饭煲、彩色打印机、激光扫描仪、电动滑板车、电动自行车、电动公交车、太阳能电池板、路由器、平板电视、无人机、起重机、熊猫、熊猫玩偶、围棋、魔方、积木、拼图、陀螺、风筝、太极拳、功夫电影、皮影戏、汉字、剪纸、对联、广场舞、电影、瓷器、草帽、水稻种子、雨伞、快递箱、钢琴、灯泡、玻璃杯、口罩、丝袜、各种情趣玩具等。此次对DeepSeek的质疑延续了这一争议性趋势。
#美国 #人工智能 #安全 #DeepSeek
近日,美国总统唐纳德·特朗普签署行政令,暂停美国国际开发署对乌克兰的资助项目,以评估这些项目是否符合美国的外交政策目标。
这一决定导致多家乌克兰媒体面临资金短缺,不得不向读者寻求经济支持。受影响的媒体包括乌克兰独立媒体《Hromadske》和调查新闻项目《Bihus.info》,它们通过Telegram频道公开呼吁读者提供帮助。此外,乌克兰公共组织“Detector Media”和《乌克兰真理报》也因资助暂停而面临运营压力。
美国资助的暂停不仅影响了媒体,还波及到乌克兰的多个领域,包括退伍军人支持项目、农业发展和基础设施建设。例如,为退伍军人提供心理支持的“Veteran Hub”组织因资金中断被迫关闭部分服务,包括一条危机热线。
尽管乌克兰国家银行行长表示,预计2025年乌克兰仍将获得计划中的国际援助,但资助暂停的短期影响已对乌克兰社会和经济造成显著冲击。
#乌克兰 #媒体 #美国 #特朗普 #政策资金
DeepSeek 使用 Nvidia PTX 实现高效计算优化
DeepSeek 在训练其 V3 模型时,通过使用 Nvidia 的 PTX(并行线程执行)语言进行编程,实现了比标准 CUDA 更高效的性能优化。PTX 是一种中间指令集架构,位于高级 GPU 编程语言和低级机器代码之间,允许进行细粒度的寄存器分配和线程/warp 级别调整,这是传统 CUDA 无法实现的。
为了进一步提升性能,DeepSeek 对 H800 GPU 进行了重新配置,将 132 个流式多处理器中的 20 个专门用于服务器间通信,可能用于数据压缩和解压,以克服处理器连接限制并加速计算。此外,DeepSeek 还实现了高级管道算法,通过超精细的线程/warp 级别调整,最大限度地提高了计算效率。这种深层次的优化展示了 DeepSeek 工程师的技术实力,尽管维护难度较高,但为模型训练提供了显著的性能提升。
#DeepSeek #英伟达 #GPU #人工智能
DeepSeek 在训练其 V3 模型时,通过使用 Nvidia 的 PTX(并行线程执行)语言进行编程,实现了比标准 CUDA 更高效的性能优化。PTX 是一种中间指令集架构,位于高级 GPU 编程语言和低级机器代码之间,允许进行细粒度的寄存器分配和线程/warp 级别调整,这是传统 CUDA 无法实现的。
为了进一步提升性能,DeepSeek 对 H800 GPU 进行了重新配置,将 132 个流式多处理器中的 20 个专门用于服务器间通信,可能用于数据压缩和解压,以克服处理器连接限制并加速计算。此外,DeepSeek 还实现了高级管道算法,通过超精细的线程/warp 级别调整,最大限度地提高了计算效率。这种深层次的优化展示了 DeepSeek 工程师的技术实力,尽管维护难度较高,但为模型训练提供了显著的性能提升。
#DeepSeek #英伟达 #GPU #人工智能
美军F-35战机在阿拉斯加坠毁,飞行员成功逃生
当地时间2025年1月28日,美国空军一架F-35战斗机在阿拉斯加州艾尔森空军基地训练时发生坠毁事故。视频显示,飞机在降落过程中突然失去动力,机身旋转并垂直坠向地面,撞击后爆炸成一团火球。幸运的是,飞行员在坠毁前成功弹射逃生,并被送往医院接受检查,目前状况稳定。
事故发生在当地时间12点49分,具体原因尚不明确,但初步推测可能与“飞行故障”有关。美国空军第354战斗机联队指挥官保罗·汤森德表示,将对此事件进行彻底调查,以减少类似事故再次发生的可能性。
艾尔森空军基地是美国空军的重要战略基地,驻扎有54架F-35A战斗机。本次事故是美国空军第11架发生事故的F-35,此次事故再度引发对F-35战机安全性和技术可靠性的担忧。
#F35 #阿拉斯加 #空军 #美国 #坠机
当地时间2025年1月28日,美国空军一架F-35战斗机在阿拉斯加州艾尔森空军基地训练时发生坠毁事故。视频显示,飞机在降落过程中突然失去动力,机身旋转并垂直坠向地面,撞击后爆炸成一团火球。幸运的是,飞行员在坠毁前成功弹射逃生,并被送往医院接受检查,目前状况稳定。
事故发生在当地时间12点49分,具体原因尚不明确,但初步推测可能与“飞行故障”有关。美国空军第354战斗机联队指挥官保罗·汤森德表示,将对此事件进行彻底调查,以减少类似事故再次发生的可能性。
艾尔森空军基地是美国空军的重要战略基地,驻扎有54架F-35A战斗机。本次事故是美国空军第11架发生事故的F-35,此次事故再度引发对F-35战机安全性和技术可靠性的担忧。
#F35 #阿拉斯加 #空军 #美国 #坠机