DeepSeek(杭州深度求索人工智能基础技术研究有限公司)是一家成立于2023年7月17日的创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。 公司由知名量化资管巨头幻方量化创立,创始人梁文锋曾在浙江大学电子工程系人工智能方向就读。
自成立以来,DeepSeek在大模型领域取得了多项突破:
DeepSeek-V2:于2024年5月发布的混合专家(MoE)模型,具有2360亿参数,其中每次推理激活210亿参数,支持最长128K的上下文长度。该模型在性能和成本之间取得了良好平衡。
DeepSeek-V3:于2024年12月发布,采用多头潜在注意力(MLA)架构,进一步提升了推理速度和效率。
DeepSeek-R1:于2025年1月20日发布的推理模型,在数学、代码和自然语言推理等任务上表现出色,性能可与OpenAI的o1正式版媲美。
DeepSeek坚持开源策略,所有模型均采用MIT许可证,允许用户进行模型蒸馏和二次开发。 这一开放策略促进了技术社区的交流与合作,加速了AI技术的普及与应用。
截至2025年2月,DeepSeek的技术已被广泛应用于各个领域:
政务服务:广州市政务服务和数据管理局在政务外网正式部署了DeepSeek-R1和V3 671B大模型,丰富了政务服务场景应用。
搜索引擎:百度搜索全面接入了DeepSeek和文心大模型的深度搜索功能,为用户提供更丰富的搜索体验。
社交平台:微信搜一搜上线了“AI搜索”功能,部分用户可使用DeepSeek-R1提供的“深度思考”服务。
DeepSeek以其高效、低成本的技术优势,正在重塑AI生态链。公司致力于持续推进人工智能技术的发展,秉持开放合作的理念,为全球用户提供更智能、更高效的AI解决方案。
Disclaimer: This website only provides website navigation services and does not assume any responsibility or guarantee for the content of the links.