什么是资金杠杆 港科大(广州)协理副校长熊辉:DeepSeek推动AI平民化
“DeepSeek的出现标志着AI技术从‘贵族化’走向‘平民化’。”香港科技大学(广州)协理副校长、人工智能学域创始主任、讲座教授熊辉在接受广州日报记者采访时什么是资金杠杆,一语中的地道出DeepSeek对AI产业的深远影响。
熊辉以春秋时期的战争为例,形象地解释了AI技术的变革。“春秋时期的战争主要由贵族主导,因为他们拥有豪华战车和重甲装备,而普通百姓因缺乏这些资源无法参与。”他说道,“然而,弓箭的发明让步兵也能上战场,打破了贵族的垄断。”熊辉指出,DeepSeek就像AI领域的“弓箭”,让普通企业和个人在低算力环境下也能使用大模型技术,无须依赖高昂的硬件和资源。
从巨头垄断到寻常百姓家,技术正在实现普惠。熊辉进一步表示,DeepSeek的开源和平民化使得大模型技术不再是少数巨头企业的专属,而是走进了寻常百姓家。“无论是中国的硬件和软件厂商,还是全球科技巨头如亚马逊、英伟达和微软,都纷纷接入DeepSeek。”他说道。这种普及让更多中小企业能够以较低的成本(如几百万元人民币)配置低算力环境,运行自己的大模型,从而显著提升企业效率。
熊辉强调,DeepSeek的平民化,是将AI从“重装甲贵族”手中解放出来,赋予普通企业和个人参与AI竞争的机会。这种变革让更多创新者和中小企业能够在AI战场上争得一席之地,推动整个行业的多元化发展。

与此同时,熊辉从全球视角深入剖析了DeepSeek的创新之处,并详细阐述了其在逻辑推理、模型效率等方面取得了显著成果,还通过一系列技术创新为AI行业带来了深远影响。
强化逻辑推理能力:类似于AlphaGo到AlphaZero的跨越。熊辉首先强调了DeepSeek在逻辑推理方面的卓越表现。他指出,DeepSeek的成功得益于其对强化学习的巧妙运用。“与其他大模型运用人在环路的强化学习训练方法不同,DeepSeek实现了推理问题可以通过自动化方式进行验证或标注。”他解释道。这一技术的进步在于,DeepSeek仅需设定合适的奖励函数,无须人类干预,从而赋予模型更大的自主创新性和逻辑推理能力。
混合专家系统(MoE):模拟人脑分工,提升效率。DeepSeek的另一大创新是引入了混合专家系统(Mixture of Experts, MoE)。熊辉形象地比喻道:“DeepSeek利用MoE模拟人脑的分工机制,仅激活与问题相关的模块。”这种按需激活的策略不仅大幅提高了效率,还优化了资源利用,使得模型在处理复杂任务时更加灵活高效。
多头注意力机制:多任务并行,提升响应速度。DeepSeek还采用了多头注意力机制(Multi-head Latent Attention),克服了传统单注意力模型效率低下的问题。熊辉举例说明:“多头注意力机制可以同时关注多个信息点,就像多线程工作一样,显著提升了响应速度和准确性。”这一技术的应用,使得DeepSeek在处理复杂问题时更加游刃有余。
除了上述核心技术突破,DeepSeek还在通讯、网络和系统平台等方面进行了全面优化。熊辉强调:“这些综合改进共同构成了DeepSeek效率的重大提升。它不仅展示了我们在人工智能领域的开放性什么是资金杠杆,也为未来AI平权和AI产业的发展提供了新的方向和可能性。”