Memordust

15:03 · Jan 29, 2025 · Wed

杜洛夫庆祝农历新年并谈中国在人工智能领域崛起背后教育模式的竞争力

杜洛夫在其频道中发布文章庆祝中国新年（Chinese New Year），并以中国AI初创公司DeepSeek的成功为例，讨论了中国在人工智能领域的快速进步。他指出，这一成就并非偶然，而是长期以来中国学生在数学和编程国际奥林匹克竞赛中表现优异的结果。中国的中学教育体系借鉴了苏联模式，以激烈竞争为核心，能够培养出众多顶尖人才。

相比之下，西方教育体系往往避免竞争，禁止公开学生成绩和排名，以减少学生压力。然而，这种做法也削弱了优秀学生的动力，使他们对学术失去兴趣，转而投向电子游戏等更具竞争性的领域。杜洛夫认为，现实世界的竞争无处不在，无论是体育、商业还是科技，排名和优胜劣汰都是真实存在的。他以AI行业的基准测试为例，强调DeepSeek的优越性，并预测如果美国的中学教育体系不进行根本性改革，中国在科技领域的主导地位将变得不可避免。

#杜洛夫 #教育 #人工智能 #中国

Pavel Durov

⭐ Happy Chinese New Year!

Following the success of the Chinese startup DeepSeek, many are surprised at how quickly China has caught up with the US in AI. However, China’s progress in algorithmic efficiency hasn't come out of nothing. Chinese students have…

杜洛夫教育人工智能中国

12:28 · Jan 29, 2025 · Wed

泰国预计2030年建成首条高铁连接中国

泰国政府预计将在2030年建成首条高速铁路，并通过老挝与中国相连。曼谷政府将该项目视为加强泰中经贸合作的重要举措。

泰国政府发言人表示，连接曼谷至呵叻府的一期工程已完成约36%，二期工程计划延伸至廊开府，并将提交内阁审批。整条铁路全长609公里，投资约4340亿泰铢，将通过湄公河大桥与中老铁路衔接。

泰国正加强与中国的互联互通，不仅在基础设施建设方面合作，还在去年签署了互免签证协议，促进旅游和经贸往来。

#中泰关系 #高铁 #泰国 #经济

中泰关系高铁泰国经济

12:25 · Jan 29, 2025 · Wed

印度大壶节踩踏事故或已致数十人遇难

印度北方邦普拉亚格拉杰市在大壶节庆祝期间发生踩踏事故，官方尚未公布确切伤亡人数，但警方消息称，至少40具遗体已被送往医院太平间。事故发生在1月29日凌晨，成千上万名信徒聚集于河流交汇处进行圣浴仪式，部分人试图攀爬障碍物，引发踩踏。

警方表示，由于现场人群密集，暂无法提供官方伤亡数字。医院方面透露，一些死者本身患有基础疾病，伤员中有人骨折或昏迷。印度总理莫迪表示，政府正全力救助受害者。

大壶节是印度最重要的宗教庆典之一，今年预计将吸引超过4亿人参加，节日将持续至2月25日。

#印度 #节日 #事故 #安全

印度节日事故安全

12:24 · Jan 29, 2025 · Wed

南苏丹一飞机坠毁 18人死亡

一架飞机在非洲东北部国家南苏丹的北部地区坠毁，造成18人死亡。

据联合国南苏丹特派团米拉亚电台（Radio Miraya）报道，一架载有21名乘客和机组人员的飞机，星期三（1月29日）在团结州（Unity State）坠毁，导致18人丧生。这架飞机是从团结州一个油田起飞后坠毁。当局尚未就这起事件置评。

#非洲 #飞机 #坠机 #南苏丹 #空难 #事故

非洲飞机坠机南苏丹空难事故

12:22 · Jan 29, 2025 · Wed

联合国确认收到美国退出《巴黎协定》通知

联合国秘书长发言人杜加里克证实，已在1月17日收到美国正式提交的退出《巴黎协定》申请，根据协定规定，美国将在2026年1月27日正式退出。

《巴黎协定》于2015年达成，旨在限制全球气温升幅并推动可持续发展。美国曾于2016年签署，但特朗普政府此前退出，拜登上任后重新加入。特朗普近日重返白宫后，再次决定退出。联合国秘书长古特雷斯强调，美国在全球气候行动中的领导作用至关重要。联合国重申支持《巴黎协定》，呼吁各国共同努力将全球气温升幅控制在1.5°C以内。

#特朗普 #巴黎协定 #联合国 #气候 #国际

特朗普巴黎协定联合国气候国际

12:21 · Jan 29, 2025 · Wed

解放军东部战区发布新春影片《以武止戈》展现捍卫国家主权决心

1月29日农历大年初一，解放军东部战区发布新春影片《以武止戈》，展现部队战备状态和使命担当。影片展示官兵坚守战位、船舰战机演训等画面，强调“以武止戈”的战略理念，展现维护国家主权和领土完整的坚定决心。片尾背景出现台湾地图，寓意祖国统一的大势不可阻挡。

东部战区今年元旦曾发布MV《中国人》，回顾2024年台海局势，包括“联合利剑”系列军演，彰显人民解放军捍卫国家统一、维护地区和平的能力和意志。

#中国 #台湾 #统一

中国台湾统一

12:18 · Jan 29, 2025 · Wed

近九成格陵兰人反对特朗普的吞并要求

民调显示，85%的格陵兰居民反对脱离丹麦加入美国，驳斥特朗普关于当地人渴望成为美国公民的说法。仅6%支持加入美国，9%未决定。

特朗普曾多次表示出于安全考虑希望吞并全球最大岛屿格陵兰，并声称格陵兰人对丹麦不满，更愿意成为美国人。格陵兰总理埃格德回应称：“我们不想做丹麦人，也不想当美国人，我们当然希望是格陵兰人。”

此外，45%的受访者认为特朗普对格陵兰的兴趣构成威胁。若必须在丹麦和美国之间选择，只有约8%愿意成为美国公民。

#格陵兰岛 #丹麦 #特朗普 #主权 #民意

格陵兰岛丹麦特朗普主权民意

12:02 · Jan 29, 2025 · Wed

加拿大前副总理：可与特朗普政府合作削弱中国

正在竞选加拿大自由党党魁的前副总理兼财政部长弗里兰表示，加拿大可与特朗普政府合作调整全球贸易，以削弱中国在供应链中的主导地位。她认为特朗普的强硬贸易政策是为了对中国采取更严厉措施，并称加拿大可成为美国“明智的合作伙伴”。

弗里兰提到，美国新任财政部长贝森特是潜在盟友，加拿大可协助美国纠正贸易失衡。她批评中国未能兑现扩大内需的承诺，支持美国重塑全球经济格局。

弗里兰此前辞去副总理职务，批评特鲁多政府过度依赖政治手段应对经济挑战。特鲁多已宣布辞去自由党领袖与总理职务，党内竞争激烈，弗里兰正面临强劲对手卡尼的挑战。

#中加关系 #加拿大 #特朗普 #美国

中加关系加拿大特朗普美国

12:00 · Jan 29, 2025 · Wed

以色列切断与近东救济工程处所有联系

以色列常驻联合国代表达农宣布，以色列将终止与联合国近东巴勒斯坦难民救济和工程处（UNRWA）及其相关机构的一切联系。以色列指责该机构雇用加沙武装组织成员，危害以色列安全。

以色列议会于2024年10月通过法案，禁止近东救济工程处在以色列运作，该法案将于1月29日生效。该机构长期在东耶路撒冷提供教育和医疗服务，目前已开始撤离。其发言人福勒批评以色列的决定“不可接受”，称难民的未来服务仍不明朗。

#以色列 #加沙 #联合国 #中东 #人道危机

以色列加沙联合国中东人道危机

11:59 · Jan 29, 2025 · Wed

波音去年亏损118亿美元

波音公司2024年全年亏损达118亿美元，其中第四季度亏损39亿美元。

公司指出，长期劳工罢工、商用飞机安全问题以及国防合同成本超支是导致财务困境的主要原因。波音首席执行长奥特伯格（Kelly Ortberg）称，公司正在采取一系列措施以扭转局面，努力“全面恢复公司的运营表现”。

#美国 #军工 #波音 #飞机 #商业

美国军工波音飞机商业

10:57 · Jan 29, 2025 · Wed

阿里发布超大规模MoE模型Qwen 2.5-Max

1月29日凌晨，阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型。该模型预训练数据超过20万亿 tokens。目前开发者可在 Qwen Chat 平台免费体验模型，企业和机构也可通过阿里云百炼平台直接调用新模型 API 服务。

在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中，Qwen2.5-Max 表现超越了 DeepSeek V3，同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。阿里云的基座模型在大多数基准测试中都展现出了显著的优势。阿里云称随着后训练技术的进步，下一个版本 Qwen2.5-Max 将会达到更高水平。

#通义千问 #Qwen #阿里 #人工智能

通义千问 Qwen 阿里人工智能

08:35 · Jan 29, 2025 · Wed

白宫评估DeepSeek对国家安全影响

当地时间1月28日，白宫新闻秘书卡罗琳·莱维特表示，美国正在评估中国人工智能应用DeepSeek对国家安全的潜在风险，特别是涉及知识产权盗窃的可能性。白宫人工智能事务负责人大卫·萨克斯提到，DeepSeek可能通过“蒸馏”技术进行数据窃取。美国国家安全委员会目前正在进行审查，关注该技术可能对美国人工智能产业的影响。

然而，“蒸馏”是AI领域合法且广泛应用的优化技术，旨在缩小模型规模并提升效率。技术论文显示，DeepSeek蒸馏小模型主要基于开源模型(如Qwen、Llama系列)优化，而非直接使用OpenAI的专有数据。DeepSeek发布同时就开源了自身模型及并为公众蒸馏了六个小模型，技术透明，回馈社区，与“窃取”指控形成鲜明对比。

美国政界过去曾多次将中国商品、文化产品甚至日常用品与国家安全挂钩，如大蒜、龙虾、筷子、方便面、豆浆、泡菜、辣条、红枣、奶茶、火锅、煎饼果子、智能冰箱、电热水壶、电风扇、吸尘器、电蚊拍、电饭煲、彩色打印机、激光扫描仪、电动滑板车、电动自行车、电动公交车、太阳能电池板、路由器、平板电视、无人机、起重机、熊猫、熊猫玩偶、围棋、魔方、积木、拼图、陀螺、风筝、太极拳、功夫电影、皮影戏、汉字、剪纸、对联、广场舞、电影、瓷器、草帽、水稻种子、雨伞、快递箱、钢琴、灯泡、玻璃杯、口罩、丝袜、各种情趣玩具等。此次对DeepSeek的质疑延续了这一争议性趋势。

#美国 #人工智能 #安全 #DeepSeek

美国人工智能安全 DeepSeek

06:24 · Jan 29, 2025 · Wed

美国副总统万斯：科技巨头必须尊重宪法权利

美国副总统万斯（JD Vance）表示，大型科技公司权力过大，必须尊重美国宪法赋予公民的权利，停止审查言论，否则将面临特朗普政府的潜在制裁。

此番言论凸显了特朗普政府对科技巨头的强硬立场，或预示未来可能出台针对性政策，以削弱其对社交媒体及信息传播的控制力。

#美国 #科技 #监管 #特朗普 #言论自由 #社交媒体

美国科技监管特朗普言论自由社交媒体

06:19 · Jan 29, 2025 · Wed

特朗普要求马斯克接回滞留太空的两名美国宇航员

当地时间28日，美国总统特朗普在其社交媒体平台“真实社交”上发文表示，他已指示美国太空探索技术公司（SpaceX）及其首席执行官马斯克，采取行动接回滞留在国际空间站的两名美国宇航员。

这两名宇航员于去年6月5日搭乘波音“星际客机”飞赴空间站，这是“星际客机”首次载人试飞任务。飞船原定于6月14日返航，但因推进器故障和氦气泄漏等问题，返航时间一再推迟。

#美国 #航天 #特朗普 #马斯克 #SpaceX #事故

美国航天特朗普马斯克 SpaceX 事故

05:40 · Jan 29, 2025 · Wed

苹果M系列芯片曝新漏洞，用户信息安全再临威胁

近日，佐治亚理工学院的研究人员发现了苹果M2、M3、A15和A17芯片存在两个新的安全漏洞，分别为SLAP和FLOP。这些漏洞与处理器预测执行技术有关，可能被黑客利用来窃取用户的敏感信息，例如邮件和信用卡信息。研究人员早在一年和六个月前就已将漏洞报告给苹果，但苹果至今未发布修复方案。

外界推测，由于问题涉及硬件层面，可能需要等到M4芯片发布才能彻底解决。这两个漏洞与英特尔此前的Spectre和Meltdown漏洞类似，但专门针对苹果硬件设计，对苹果用户构成特定安全威胁。

#苹果 #信息安全 #芯片 #漏洞

苹果信息安全芯片漏洞

05:20 · Jan 29, 2025 · Wed

乌克兰媒体因美国资助暂停呼吁读者支持

近日，美国总统唐纳德·特朗普签署行政令，暂停美国国际开发署对乌克兰的资助项目，以评估这些项目是否符合美国的外交政策目标。

这一决定导致多家乌克兰媒体面临资金短缺，不得不向读者寻求经济支持。受影响的媒体包括乌克兰独立媒体《Hromadske》和调查新闻项目《Bihus.info》，它们通过Telegram频道公开呼吁读者提供帮助。此外，乌克兰公共组织“Detector Media”和《乌克兰真理报》也因资助暂停而面临运营压力。

美国资助的暂停不仅影响了媒体，还波及到乌克兰的多个领域，包括退伍军人支持项目、农业发展和基础设施建设。例如，为退伍军人提供心理支持的“Veteran Hub”组织因资金中断被迫关闭部分服务，包括一条危机热线。

尽管乌克兰国家银行行长表示，预计2025年乌克兰仍将获得计划中的国际援助，但资助暂停的短期影响已对乌克兰社会和经济造成显著冲击。

#乌克兰 #媒体 #美国 #特朗普 #政策资金

乌克兰媒体美国特朗普政策资金

05:17 · Jan 29, 2025 · Wed

DeepSeek 使用 Nvidia PTX 实现高效计算优化

DeepSeek 在训练其 V3 模型时，通过使用 Nvidia 的 PTX（并行线程执行）语言进行编程，实现了比标准 CUDA 更高效的性能优化。PTX 是一种中间指令集架构，位于高级 GPU 编程语言和低级机器代码之间，允许进行细粒度的寄存器分配和线程/warp 级别调整，这是传统 CUDA 无法实现的。

为了进一步提升性能，DeepSeek 对 H800 GPU 进行了重新配置，将 132 个流式多处理器中的 20 个专门用于服务器间通信，可能用于数据压缩和解压，以克服处理器连接限制并加速计算。此外，DeepSeek 还实现了高级管道算法，通过超精细的线程/warp 级别调整，最大限度地提高了计算效率。这种深层次的优化展示了 DeepSeek 工程师的技术实力，尽管维护难度较高，但为模型训练提供了显著的性能提升。

#DeepSeek #英伟达 #GPU #人工智能

DeepSeek 英伟达 GPU 人工智能

05:15 · Jan 29, 2025 · Wed

美军F-35战机在阿拉斯加坠毁，飞行员成功逃生

当地时间2025年1月28日，美国空军一架F-35战斗机在阿拉斯加州艾尔森空军基地训练时发生坠毁事故。视频显示，飞机在降落过程中突然失去动力，机身旋转并垂直坠向地面，撞击后爆炸成一团火球。幸运的是，飞行员在坠毁前成功弹射逃生，并被送往医院接受检查，目前状况稳定。

事故发生在当地时间12点49分，具体原因尚不明确，但初步推测可能与“飞行故障”有关。美国空军第354战斗机联队指挥官保罗·汤森德表示，将对此事件进行彻底调查，以减少类似事故再次发生的可能性。

艾尔森空军基地是美国空军的重要战略基地，驻扎有54架F-35A战斗机。本次事故是美国空军第11架发生事故的F-35，此次事故再度引发对F-35战机安全性和技术可靠性的担忧。

#F35 #阿拉斯加 #空军 #美国 #坠机

F35 阿拉斯加空军美国坠机

05:09 · Jan 29, 2025 · Wed

美国参议员推动禁止青少年使用社交媒体的法案

美国参议员布莱恩·沙茨和特德·克鲁兹再次提出《儿童远离社交媒体法案》(KOSMA)，旨在禁止社交媒体平台允许13岁以下儿童使用其服务。该法案要求平台删除13岁以下用户的所有账户及其相关数据，并禁止使用17岁以下用户的数据进行算法推荐。此外，法案还规定学校需阻止学生在校园设备和网络上访问社交媒体。尽管该法案去年未能通过委员会阶段，但当前政治形势可能为其提供更多支持。

克鲁兹表示将全力推动该法案通过委员会并成为法律。此举引发了对青少年心理健康和数据隐私的关注，但也引发了对法案实施难度和潜在影响的讨论。

#社交媒体 #青少年 #安全 #政策

社交媒体青少年安全政策

03:59 · Jan 29, 2025 · Wed

著名人工智能社区 Hugging Face 的工程师马修·卡里根展示了在本地运行 Deepseek-R1 的完整硬件和软件设置。他使用的是 670B 参数的模型，无蒸馏处理，采用 Q8 量化技术，能够实现全质量推理。整个系统的总成本约为 6000 美元，性价比极高。

硬件方面，主板使用技嘉 MZ73-LM0 或 MZ73-LM1，它们具有 2 个 EPYC 插槽，提供 24 个 DDR5 RAM 通道。CPU 方面，可以使用 2 个 AMD EPYC 9004 或 9005 CPU（任何的）。他强调，LLM 的瓶颈在于内存带宽，因此不需要高端 CPU，如果想降低成本，可以购买 9115 甚至 9015。内存是这套系统的关键部分，为了适应 670B 模型的需求，马修配置了 768GB 的内存，具体是 24 个 32GB 的 DDR5-RDIMM 模块，这样做的目的是充分利用 24 个内存通道，确保内存带宽足够快，从而提升模型的推理速度。尽管这套系统的功耗并不高（低于 400W），但由于需要为两个 EPYC CPU 供电，马修选择了 Corsair HX1000i 电源，这款电源不仅功率足够，还提供了大量的 CPU 电源接口，能够满足系统的供电需求。机箱需要支持完整尺寸的服务器主板，并且要有足够的螺丝安装座，散热器方面，马修选择了兼容 AMD EPYC SP5 插槽
的型号，确保 CPU 在高负载下也能保持稳定运行。为了加速模型的加载过程，马修推荐使用 1TB 或更大容量的 NVMe SSD，在启动模型时，需要将 700GB 的模型数据从 SSD 复制到内存中，NVMe 的高速度可以显著减少加载时间。

软件部分，首先需要安装 Linux 操作系统，然后进入 BIOS 设置，将 NUMA 组数设置为 0，确保模型的每一层数据都交错分布在所有的 RAM 芯片上，从而提升内存吞吐量。接下来，安装 Llama 框架，并下载 700GB 的 DeepSeek-R1-Q8_0 版本。一切就绪后，就可以使用以下代码运行 Deepseek-R1： llama-cli -m ./DeepSeek-R1.Q8_0-00001-of-00015.gguf --temp 0.6 -no-cnv -c 16384 -p "<｜User｜>How many Rs are there in strawberry? <｜Assistant｜>" 。运行后，系统会经历一个短暂的加载过程，随后模型开始在本地思考问题并生成结果。

马修指出，系统生成速度约为 6~8 tokens/s，虽不及 GPU 方案快，但考虑到成本，这完全是一个可接受的折中方案。该方案完全基于 CPU，未使用 GPU，因此成本较低。他特别强调，Q8 量化的 670B 模型在质量上与 Deepseek API 提供的服务几乎没有区别。若想进一步提升速度，可考虑使用 GPU，但成本会大幅增加，例如使用 2 块 H100 GPU 的方案可能需要 10 万美元左右。此外，马修方案还未与 Mac mini 统一内存架构方案进行对比，Mac mini 方案可能在部署上更简单，但扩展性和性价比可能不如这套 EPYC 系统。

社区用户 yhfgyyf 对类似配置进行了测试，使用双路 EPYC 9755 处理器，单 CPU 支持 12 通道 DDR5-4800 内存。测试结果显示，最有效的配置是单 CPU 64-96 核，内存频率越高越好，且无需开启超线程功能。他还提到，实际运行中，512 线程的性能反而不如 128 线程，建议根据需求调整线程数。另一位用户 KPX 提到，Unsloth 的动态量化技术可将 Deepseek 模型压缩到 131GB，最低运行内存需求降至 80GB，为资源有限的用户提供了更多选择。关于性能，token/s 主要取决于等效总带宽，因为 LLM 推理是存储密集型任务，4090 显卡的显存带宽约为 1TB/s，而 CPU 方案通过高频 DDR5 和多通道优化也能达到不错的性能。最重要的是确保 NUMA 节点的负载均衡，否则 token/s 可能会大幅下降。

#非新闻信息 #DeepSeek #本地部署 #教程

非新闻信息 DeepSeek 本地部署教程