AI搜索引擎在欧洲亲眼见证DeepSeek震撼

  DeepSeek     |      2025-03-16 20:02

  DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!

AI搜索引擎在欧洲亲眼见证DeepSeek震撼

  我今天演讲的主题是——中文在人工智能时代的优势。DeepSeek之所以爆火,主要并不是它技术上获得了突破性的进展,而是其效率获得了数量级的提升,从而使得它在相同性能的情况下,成本可以下降将近二十多倍。

  在中国古代的时期,中国对周边国家在文化上有压倒性的优势。其他地区对中国也有着非常仰慕的心态。但随着中国在近代的落后,尤其是甲午战争失败以后,导致很多中国知识阶层开始反思自身。首先反思的就是我们的文化,也包括我们自己的语言文字。这种反思很快就发展到了极端,甚至有人认为汉字阻碍了中国进入现代科技文明。也有人认为中国应当放弃中文这种象形文字形态,应该改成像拼音这样的字母文字。

  随着以电子计算机为代表的信息技术出现以后,中文在计算机键盘输入上存在一定的困难。因为计算机键盘来自英文的打字机,所以输入英文当然是最简单方便的。因此,过去曾经认为中文阻碍了中国进入现代科技文明的观点和思潮,在信息技术时代又再一次沉渣泛起。但是, 二十世纪八十年代,中国科技界在汉字输入上做了大量的工作,在当时被称为叫“万码奔腾”。

  这些汉字输入的工作在很大程度上降低了中文电脑输入的困难。其中比较著名和主流的有五笔字型输入法,也叫王码,是王永民先生发明的。那么另外一个常用的输入法是拼音输入法。虽然客观上说,直到今天中文还是比英文等字母文字的键盘输入稍微麻烦那么一点点。但是这些中文输入法,在很大程度上,已经有效解决了中文在计算机上的输入问题。在五笔字型输入法的基础上,充分采用词组输入以后,它的输入效率甚至还可以超过英文的输入。

  相比之下,英文单词的长度,从一个字母到十几个字母的都有,这样的字母文字,每个单词它发音的长度可能都是不一样的。像英文里面的“祝贺”,是“Congratulations”,这就有15个字母。我们可能会好奇,那最长的英文单词会有多少个字母呢?如果我们到网上去搜索的话,可能会发现很多不一样的答案。

  还有一个问题是很多英文的句子,它的发音会有连读的情况,比如说what’s your name,那么这就更加难以区分出每个单词。虽然现在这些问题在人工智能的语音识别中都已经解决了,但是它解决的技术难度,确实要比中文困难很多,需要更大的运算量,而且几乎所有的字母文字都存在这个问题。

  第二,汉字的信息密度一般比字母文字要高,这体现在很多方面。汉字是一个表意文字,内涵很丰富,可以用词组、成语等很少的汉字表达相当丰富的含义。尤其像文言文,它的信息密度就更高了。对于人工智能来说,最终它体现的是,相同含义的一段语言或文字,在计算机中需要有多少存储量和计算量。一般来说,中文的存储量和计算量都是最少的。如果我们对比一下相同内容的中英文,中文一般页数或者篇幅是最少的。

  但我们要注意,这并不是完全绝对的,因为英文也有自身的优点,比如说它相对比较严谨,所以比较严谨的一些论文或法律文书里面,英文的信息密度与中文的差异就没有那么大了。但是由于绝大多数情况下,中文的信息密度的确是比较高的,所以在人工智能的训练中,相同内容的情况下,中文训练的存储量和计算量就会比较少。这是中文效率优势的第二个体现。

  第三,是中文的稳定性。汉字是相对比较稳定的一种语言,我们今天使用的汉字与几千年前的甲骨文其实挺接近的。对于新出现的事物,汉字是通过常用的一些字去建立新的词组从而适应。并且,这样的词组天然地会存在有规律的分类特性,比如机器的“机”,可以组成拖拉机、播种机、飞机、纺织机、发动机、蒸汽机、计算机,如此之多的机器汉字都可以用“机”这个形成词组来表达。

  相比之下,英文每年都会增加大量的新词,常用的单词都可能会发生变化。当然我们提到中文在人工智能时代的技术优势,并不是要把它过度地拔高,只是从以上不同技术时代,中文技术优劣势的变化过程中,希望我们能更客观地看待我们中国自己的文化。在进入人工智能时代,我们更应该发挥中文的优势,使得中国在人工智能时代可以获得更快的发展,并且有更好的经济效益。

  刚才汪涛老师做了非常精彩的演讲。其实DeepSeek能够一下子火出圈,这让各行各界都为之震动。它可以说并不是“唯算力论”的,而是用种种方法提升了自己的效率。刚才汪涛老师在分析中提到,提升效率的种种途径当中非常重要的一条,同时也是不能忽视的一条——因为它用的是中文。所以这也是我们的一种文化自信。张老师您以前在联合国工作的时候,看各国文字的文件,是不是中文的文件特别薄一点?

  另外这次DeepSeek的突破让我联想到我之前写过的一本教科书——《英汉同声传译》,至今仍然在使用。我举一个例子,比方说,一句很简单的话:你不去,我去。这五个字,你要翻成英文的话是:“You don’t go, I go”。这么翻译当然很简单粗暴,但实际上中文这五个字,还可以放在上下文里来理解的。比方说你可以理解成,“If you don’t go,I will go”,即如果你不去,我去。这是一种假设关系。也可能是一种让步关系,比方说,即使你不去,我也去。

  对,所以大家也要注意到一个问题,就是大语言模型和通用人工智能,这两个概念往往会被混在一起说,但其实这是有区别的。大语言模型不能完全说它就是通用人工智能,它的确比以前的应用扩展了很多,尤其是它作为一个生成式的人工智能,这最初就是从机器翻译技术里面过来的。因为它可以生成各种各样你想要的答案,所以感觉它的通用性会比过去强很多。但是真正你要在不同领域去应用的话,还是需要各个不同的人工智能技术。

  另外,他们说要搞欧洲的人工智能通用大模型,一个重要原因是要体现欧洲的价值观。你发现没有,大模型处理是有价值观的。在语言当中你输进去不同的语料,出来的东西也是不一样的,对不同问题的回答和描述也是不同的。

  我想起德国哲学家维特根斯坦说过的名言:你讲这个语言,这个语言也讲你。(You speak a language,language also speaks about you.)你的整个文化背景都在你使用的语言里。你看我们前段时间去蒙古国访问,蒙古国盛产绵羊,相关的英文表述复杂得不得了:羊(sheep),羊肉(mutton) ,羊毛(wool),羊绒(cashmere)。

  这次德意志银行关于中国资产的报告中,核心概念开始改变,过去它们认为中国资产只是tradable,也就是可以买来作为交易的,短线的,或者小打小闹玩玩的;现在叫investable,就是可以投资的。这是认知方面的巨大变化。所以说一个超级产品出现之后,它带来的是整个外部世界对中国看法的改变。

  我以前有个观点叫“遏制背反定律”,就是遏制有多大,它的促进力就有多大。DeepSeek就是一个非常典型的例子,因为它如果不是在这种限制、封锁越来越严厉的情况下,它不会想到去大幅度地提升效率。因为没有芯片可用了,它只好去把效率极大地提升,无止境地去挖掘,挖掘到最后,我用现有的这些芯片就可以来玩大模型,这一定程度上也是被美国逼出来的一个创新。

  那么DeepSeek一走通后,不仅让美国原来的封锁垮掉,而且让英伟达建立的整个体系,或者说它以前的商业逻辑,一下都垮掉了。

  中国的整个产业链已经非常完善了,这一点就体现在刚才谈到的:我们一条路走不通,可以走另外一条路。过去无论是在芯片还是在人工智能上,要想提升运算速度,有很多条路径可以走,提升集成度也有很多条路径可以走,所以你用28纳米也可以做出跟14纳米集成度一样的芯片。只不过可能在别的方面损失一点,但实际上它是可以实现的。

  那么像这一次DeepSeek为什么能够实现这么大的突破?事实上如此大程度的效率提升,它的潜力其实一直都存在,只不过过去都是沿着美国的路径设计的。因为整个技术发展的路径都是被这些西方核心芯片公司所引导的,比如在很多人的概念中,电脑久了以后运算速度会下降,但如果我们知道怎么配置,其实可以保持运算速度做到几乎不变。

  所以,过去由美国的技术公司主导着技术发展的方向。但是现在美国制裁之后,逼着中国去找别的路径,最后我们发现其实能走的路很多,我们可以通过很多方法去提升效率。

  对我们的启发就是,我们一定要有自己的话语,尤其不要总是跟随着美国的话语、华尔街的话语、资本力量的话语。为什么我们当时对美国的经济判断相对比较准确,对特朗普当选的预测也比较准确,一个重要原因是因为我们解构了它的话语,解构之后你就非常自信。美国经济情况不好,实际上科技情况也不是很好,所以这对我们很多媒体人、学者、一些科技工作者也是个教训,我们分析任何事情,要有独立自主的思考,现在到这个阶段了。

  首先我们排除那些可靠性要求特别高的内容。比如说工业控制,不能轻易地使用,因为你出一次错,那造成的损失会很惨重。其次。军事情报不要去轻易用。因为大模型的这种“幻觉”,它在理论上是不可能消除的。所以它可以做参考,在其他一些对可靠性、精确度要求不那么高的领域,它确实应用可以更广。尤其是像文创,本身它就是描述一种感觉。

  观众:今天想请教几位老师的一个问题是:DeepSeek 的开源策略会如何推动中国在AI领域形成非对称技术竞争能力,突破美国的技术封锁?中国在今后是否会加大对开源社区的政策支持?

  在大模型时代,事实上在DeepSeek之前也有开源的,像麦塔也开发过一个大模型就是开源的。但为什么DeepSeek的开源,实现了这么大的冲击?原因就是效率的提升,它不是说百分之几十的提升,甚至不是一倍的提升,而是数量级的提升。这带来的影响本身就非常震撼。所以不是说软件开源了,它的经济性就一定好。

  除此之外,DeepSeek还有一个对中国很大的影响。我们都知道,人工智能的大模型目前还处于初级阶段,标准还未完全形成。过去为什么Linux很难撼动微软在操作系统的地位?因为标准已经被微软建立起来了,整个生态已经建立起来了。

  DeepSeek的开发主要是人工智能软件相关的开发,如果中国的人才积累没有达到现在非常雄厚的基础,那要开发是很难的。那么DeepSeek起来以后,它会连带影响其他生态的建立,比如人工智能的芯片。过去人们的概念中只有用英伟达的芯片,现在DeepSeek将效率提升后,我们可能没有那么依赖高性能的芯片,也可以带动中国人工智能芯片的爆炸性增长。对于下游环节的各种应用场景,这种生态的建立也是有很大作用的。

  刚才张老师谈到说,欧洲也想建立基于它自身价值观的“DeepSeek”,所以这个影响是非常快的。

  差不多去年的这个时候,我们讨论的是ChatGPT 4。当时我们还讨论它的文生视频。其实文生视频,张老师当时一直说这是一个概念,你可能做个短视频可以,但做长的就不行。因为我们也在节目里说过,这是非常耗电的,电力支撑很容易供应不上。但是刚才汪老师说因为DeepSeek它提供了效率,它不是“唯算力论”,而是数量级地降低了对算力的依赖,所以这也就意味着它将会数量级地降低对能源的依赖。

  这个问题的出现是因为摩尔定律逐渐达到了极限。原来芯片不断在发展,我们对算力的需求也在不断增长,过去没有这个问题,现在为什么出现了这个问题?在摩尔定律还有效的时代,我提升几倍、十几倍的算力,它是可以保持功耗不变的。即使随着集成度的提升,在实现更高算力的情况下,它的功耗也一直维持在一个水平上。但是现在因为摩尔定律越来越接近极限,这就意味着伴随运算能力提升,功耗很难再降低了。

  因此,现在我们可以看到很多给最初计算机降温的技术,甚至水冷技术、液冷的技术都用上了。这就意味着,算力的增长必然带来功耗的同步增长,或者说虽然没有完全同步,但是影响会很大。

  DeepSeek的出现给了我们另外一个方向:我们不用单纯地去追求算力,而应该降低对算力的需求,这也是一个节省能源的方法。不仅仅DeepSeek可以这么干,大模型、人工智能也可以这么干,因为我研究生时候的课题,是在个人计算机上面实现过去巨型机的卫星云图处理。当时我们就采用了各种各样降低算力需求的方法,过去我们也听到说中国研究,那时候没有高性能计算机,是由算盘打出来的。

  观众:两位老师好。主持人好,我是陈希赟,来自上海,我是一名硕士二年级的在校学生。考虑到最近DeepSeek 和宇树科技都特别火,我想了解一下国家在相关方面的一些前沿布局是什么?以及我作为一个即将毕业参加秋招的学生,我也想了解一下,我可以重点关注什么行业和领域?

  涉及到就业的问题就相对比较复杂一些。但不管怎么样,最重要的是你的能力,比如说我在大学的专业是电子测量,但是后来我们一个班的很少有人专门做这个工作,但是你掌握的工具,它的应用面是很广的,就你可以去做很多别的工作,根据市场的变化,可以很容易去适应。

  我前两天跟一个大学教授有个对话,他都是要求他的学生交读书笔记的,但是最近他发现,这些学生交上来的读书笔记有很浓的DeepSeek痕迹,所以他说他打算改一个方式,跟自己的硕士博士生面对面地让他们谈谈读某本书的感受。所以我就在想,可能DeepSeek可以帮助大家初步地做些什么,但是最后的成果你应该远远超出它,这样才是一个好的作品。

  刚才我们也聊到人工智能可能在未来生活当中的一些应用。但回过头来讲,我们今天的话题从DeepSeek火出圈开始,到汪老师解释为什么它可以不要“唯算力论”来提高自己的效率。我想,包括DeepSeek在内的很多科技公司的成功,一方面在于我们这些年,其实在科创生态上始终努力地布局,另一方面在于许许多多该领域从业者的心血努力。

  另外,我们也可以看到像这样的一些公司的崛起和发展,毫无疑问还会继续重塑我们中国的整个科创生态,带来许许多多新的局面,也让我们一起期待。谢谢演播室的两位嘉宾,谢谢大家一起来参与讨论,再见。