网站首页 > 技术文章 正文
《科创板日报》3月25日讯(编辑 宋子乔)3月24日晚间,DeepSeek上线了小版本更新后的DeepSeek-V3模型。新模型的版本号为DeepSeek-V3-0324,模型参数为6850亿,较初代V3版本的6710亿有小幅增长。DeepSeek尚未放出新版模型的系统卡。
开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
值得注意的是,DeepSeek将开源秉持到底,这次将DeepSeek-V3模型的开源协议更新为与DeepSeek-R1一致的MIT协议,这一协议更为宽松,允许模型蒸馏、商用等行为,给了开发者更多的自主权。
在性能上,编程能力的优化成了最大亮点,新版本DeepSeek-V3生成前端代码的能力大大提升。
网友让模型设计的天气页面(左由新版DeepSeek-V3生成;右由初代DeepSeek-V3生成)
网友用V3新版本设计的个人网站页面
网友用V3新版本写的小游戏
网友用V3新版本写的文字卡片
据多个博主的测试,新版DeepSeek-V3在网站开发能力、UI设计方面表现优秀,只需要简单的文本提示就能快速开发各种网站、App,审美比肩目前全球最强的闭源代码模型Claude 3.7 Sonnet思维链版本。
由新版DeepSeek-V3生成
由Claude 3.7 Sonnet生成
图1 DeepSeek V3生成
图2 DeepSeek V3 0324生成
图3 Claude Sonnet 3.7生成
《科创板日报》曾报道过初代DeepSeek-V3,该模型甫一上线便以性价比“闻名”。在多项基准测试中,DeepSeek-V3的成绩超越了Qwen2.5-72 B和Llama-3.1-405 B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
幻方量化在已开源的论文中强调其训练成本极低——通过对算法、框架和硬件的优化协同设计,假设H800GPU的租用价格为每块GPU2美元/小时,DeepSeek-V3的全部训练成本总计仅为557.6万美元(注:该成本仅包括DeepSeek-V3的正式训练,不包括与先前在架构、算法或数据上的研究和消融实验相关的成本)。
DeepSeek-V3的API服务定价将上调为每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元,按缓存未命中的输入价格计,加总成本是10元人民币。
同类型模型中,OpenAI的GPT 4o定价相当高,输入:5美元/百万Token,输出:15美元/百万Token,加总成本是20美元,约合人民币140元。
(科创板日报 宋子乔)
猜你喜欢
- 2025-05-25 Gemini 2.5 Pro 0506发布,编程最强大模型, 碾压 Claude3.7 sonnent
- 2025-05-25 Screenshot to Code:把设计图直接转成代码
- 2025-05-25 【推荐】强&牛!一款开源免费的功能强大的代码生成器系统!
- 2025-05-25 1秒出图,全球最快的开源Stable Diffusion出炉
- 2025-05-25 一个开箱即用的代码生成器
- 2025-05-25 代码自动生成软件
- 2025-05-25 开发效率提升100倍!腾讯云AI代码助手正式搭载DeepSeek-V3-0324顶级模型
- 2025-05-25 零前端经验?我用DeepSeek自动生成Vue3代码,搞定CRUD页面!
- 2025-05-25 Stitch:一款基于生成式AI的UI设计与前端代码生成工具
- 2024-09-24 springboot在线配置报表、设计流程及一键生成前后端快速开发平台
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- 前端设计模式 (75)
- 前端性能优化 (51)
- 前端模板 (66)
- 前端跨域 (52)
- 前端缓存 (63)
- 前端react (48)
- 前端aes加密 (58)
- 前端md5加密 (49)
- 前端路由 (55)
- 前端数组 (65)
- 前端定时器 (47)
- 前端接口 (46)
- Oracle RAC (73)
- oracle恢复 (76)
- oracle 删除表 (48)
- oracle 用户名 (74)
- oracle 工具 (55)
- oracle 内存 (50)
- oracle 导出表 (57)
- oracle 中文 (51)
- oracle链接 (47)
- oracle的函数 (57)
- mac oracle (47)
- 前端调试 (52)
- 前端登录页面 (48)
本文暂时没有评论,来添加一个吧(●'◡'●)