DeepSeek是AI原生应用的临界点吗?未来企业的护城河在哪? | 直播回顾第三弹
2025-03-19
随着DeepSeek的持续火热,企业对AI的期待与困惑并存。AI原生应用是否已经迎来临界点?在大模型时代,企业如何构建真正的护城河?DeepSeek的能力边界又在哪里?近日,美高梅官网正网高级技术总监吴昊宇受邀做客51CTO直播间,分享了他对行业问题的深度思考。
直播干货已整理为系列文章,欢迎点击近期文章阅读。
吴昊宇:从推理模型引起的热潮和社会反响来看,DeepSeek R1的影响力远超之前OpenAI o1,其历史意义怎么夸赞都不为过。然而,是否是AI原生应用的临界点,仍有待商榷。目前,DeepSeek R1在应用层面的直接帮助有限,它的核心价值在于推理逻辑给大家带来的震撼。
AI作为工具的plus功能,与完全构建在AI之上的工具,是两种截然不同的应用。目前大多数AI应用仍需要人类主导思路调整和纠错,未来AI编程工具是否会完全取代人类干预,成为真正的AI原生应用,这不仅是技术问题,更是对工程师的严峻挑战。
吴昊宇:用数学公式Y = f(X)来类比,其中X是数据,f是大模型,Y是最终结果。过去,各企业掌握的f(模型能力)存在差异,但如今,当大家的f趋同,决定结果的关键就变成了X。
X主要是指场景或者行业数据,在其他因素趋同的情况下,企业拥有的数据将成为影响结果最大的变量。谁掌握了垂直行业中的独特数据或独家数据,谁就能在行业中占据先机,而更多的垂直行业经验和场景可以带来更多的垂直行业数据。未来,数据将成为企业的核心护城河。
吴昊宇:能力边界是一个复杂问题。我们看到,网上有人直接让DeepSeek推荐股票,这其实就是错用了DeepSeek的能力边界,因为它并不对结果负责。在不同的场景下,能力边界要进行严格的测试。
大模型在发布时要通过各种标准数据集,进行数学能力、常识能力、推理能力,以及编程能力等多项评测,但这些测试集是否能完全代表其真实能力,需要大家在实际场景中验证。
目前的测试多以填空题、选择题为主,只能证明模型在标准化问题上的表现。实际业务场景却往往并不是以标准化问题的形式出现。模型的回答能否满足企业需求,需要在不同场景中不断测试。此外,如何通过提示词或提供更好的上下文消除幻觉,也是需要在实际应用中不断评测模型的方向。
吴昊宇:我们主要进行了针对R1的适配工作。包括在内部的Agent Builder平台、知识库管理平台,以及企业级一站式大模型应用“小明助理”上,将R1的推理过程进行了明确展示。无论是底层架构、中间件平台,还是上层应用,我们都围绕推理模型进行了相关适配工作。
DeepSeek的出现无疑为AI应用带来了新的机遇和挑战,在推理逻辑上的突破已经为企业提供了新的思路。
未来,企业需要在数据积累、行业洞察和技术创新上持续发力,才能构建真正的护城河。AI原生应用的临界点或许尚未到来,但企业已经在路上。
信息填写