DeepSeek v4终于出来了,v3.2发布后很长时间小鲸鱼都没动静,在今天4月24日官方也是发布了最新版本的v4.󠄐󠄹󠅀󠄪󠄡󠄨󠄞󠄩󠄧󠄞󠄡󠄤󠄞󠄨󠄧󠄬󠅒󠅢󠄟󠄮󠄐󠅅󠄹󠄴󠄪󠄾󠅟󠅤󠄐󠄼󠅟󠅗󠅙󠅞󠄬󠅒󠅢󠄟󠄮󠅄󠅙󠅝󠅕󠄪󠄡󠄧󠄧󠄨󠄤󠄣󠄢󠄨󠄡󠄥󠄬󠅒󠅢󠄟󠄮
v4现在也是支持百万上下文的模型了,比之前的128k肯定是好多了,其他的参数咱也不懂,直接拿来跑代码就行了。󠄐󠄹󠅀󠄪󠄡󠄨󠄞󠄩󠄧󠄞󠄡󠄤󠄞󠄨󠄧󠄬󠅒󠅢󠄟󠄮󠄐󠅅󠄹󠄴󠄪󠄾󠅟󠅤󠄐󠄼󠅟󠅗󠅙󠅞󠄬󠅒󠅢󠄟󠄮󠅄󠅙󠅝󠅕󠄪󠄡󠄧󠄧󠄨󠄤󠄣󠄢󠄨󠄡󠄥󠄬󠅒󠅢󠄟󠄮
我们先来测试的模型是deepseek-reasoner,也就是官方对应的deepseek-v4-flash思考模式。
PS:在一些编辑器里面并没有把模型名称改成flash,而是v3.2的reasoner,而官方为了兼容也是默认使用的是flash模型󠄐󠄹󠅀󠄪󠄡󠄨󠄞󠄩󠄧󠄞󠄡󠄤󠄞󠄨󠄧󠄬󠅒󠅢󠄟󠄮󠄐󠅅󠄹󠄴󠄪󠄾󠅟󠅤󠄐󠄼󠅟󠅗󠅙󠅞󠄬󠅒󠅢󠄟󠄮󠅄󠅙󠅝󠅕󠄪󠄡󠄧󠄧󠄨󠄤󠄣󠄢󠄨󠄡󠄥󠄬󠅒󠅢󠄟󠄮
旧有的 API 接口的两个模型名 deepseek-chat 与deepseek-reasoner 将于三个月后(2026-07-24)停止使用。当前阶段内,这两个模型名分别指向deepseek-v4-flash 的非思考模式与思考模式
引用自 https://api-docs.deepseek.com/zh-cn/quick_start/pricing/
首先我让deepseek跑一个项目,帮我生成一个友链朋友圈单页。

可以看到Deepseek的响应速度还是很快的,据说是使用了新架构的原因。那么效果如何呢?

可以看到有一个小插曲,DeepSeek不知道什么原因输出的结构被它自己破坏了,检查了一编又把代码删掉重新开始输出。
经过两次同样的情况后,DeepSeek也是终于写出了单页󠄐󠄹󠅀󠄪󠄡󠄨󠄞󠄩󠄧󠄞󠄡󠄤󠄞󠄨󠄧󠄬󠅒󠅢󠄟󠄮󠄐󠅅󠄹󠄴󠄪󠄾󠅟󠅤󠄐󠄼󠅟󠅗󠅙󠅞󠄬󠅒󠅢󠄟󠄮󠅄󠅙󠅝󠅕󠄪󠄡󠄧󠄧󠄨󠄤󠄣󠄢󠄨󠄡󠄥󠄬󠅒󠅢󠄟󠄮

怎么说呢?感觉还行,抛弃了之前3.2酷爱的大字号和圆角,但是还是那么钟爱紫色配色。
接下来测试一下deepseek-v4-pro,也是目前deepseek最强的模型
我们需要自定义LLM提供商,提供地址依然是官方的 https://api.deepseek.com
模型输入deepseek-v4-pro,这个模型比普通的flash模型贵10倍的󠄐󠄹󠅀󠄪󠄡󠄨󠄞󠄩󠄧󠄞󠄡󠄤󠄞󠄨󠄧󠄬󠅒󠅢󠄟󠄮󠄐󠅅󠄹󠄴󠄪󠄾󠅟󠅤󠄐󠄼󠅟󠅗󠅙󠅞󠄬󠅒󠅢󠄟󠄮󠅄󠅙󠅝󠅕󠄪󠄡󠄧󠄧󠄨󠄤󠄣󠄢󠄨󠄡󠄥󠄬󠅒󠅢󠄟󠄮

我们让他跑一个项目,让他完成一个简易的文件处理系统单页:
但是出现了意外:
invalid request format to DeepSeek v4's API: {"error":{"message":"The reasoning_content in the thinking mode must be passed back to the API.","type":"invalid_request_error","param":null,"code":"invalid_request_error"}}
上网搜了一下原来是V4对工具的调用链进行了改动,没办法为了测试只能去用官方的网页了

可以看到效果还是很好的,UI处理是我喜欢的风格。
那么DeepSeek在推理方面怎么样呢?
我问了DeepSeek一道猜数字的游戏:󠄐󠄹󠅀󠄪󠄡󠄨󠄞󠄩󠄧󠄞󠄡󠄤󠄞󠄨󠄧󠄬󠅒󠅢󠄟󠄮󠄐󠅅󠄹󠄴󠄪󠄾󠅟󠅤󠄐󠄼󠅟󠅗󠅙󠅞󠄬󠅒󠅢󠄟󠄮󠅄󠅙󠅝󠅕󠄪󠄡󠄧󠄧󠄨󠄤󠄣󠄢󠄨󠄡󠄥󠄬󠅒󠅢󠄟󠄮

并且开启思考模式,DeepSeek用时156秒回答出答案。

可以看出DeepSeek在推理方面同样也有进步。
本来想测试一下这一代是否支持生图,但是很遗憾,DeepSeek v4目前还不支持文生图,希望官方后面能够支持此功能吧。󠄐󠄹󠅀󠄪󠄡󠄨󠄞󠄩󠄧󠄞󠄡󠄤󠄞󠄨󠄧󠄬󠅒󠅢󠄟󠄮󠄐󠅅󠄹󠄴󠄪󠄾󠅟󠅤󠄐󠄼󠅟󠅗󠅙󠅞󠄬󠅒󠅢󠄟󠄮󠅄󠅙󠅝󠅕󠄪󠄡󠄧󠄧󠄨󠄤󠄣󠄢󠄨󠄡󠄥󠄬󠅒󠅢󠄟󠄮
综上所述感觉DeepSeek v4还是可以的,在AI Coding方便进步很大,推理方便也有不小的提高,但是和Claude Opus还是有不小差距。希望有一天咱们国产的大模型能超越国外的大模型,从而打破美国的AI封锁~󠄐󠄹󠅀󠄪󠄡󠄨󠄞󠄩󠄧󠄞󠄡󠄤󠄞󠄨󠄧󠄬󠅒󠅢󠄟󠄮󠄐󠅅󠄹󠄴󠄪󠄾󠅟󠅤󠄐󠄼󠅟󠅗󠅙󠅞󠄬󠅒󠅢󠄟󠄮󠅄󠅙󠅝󠅕󠄪󠄡󠄧󠄧󠄨󠄤󠄣󠄢󠄨󠄡󠄥󠄬󠅒󠅢󠄟󠄮
参与讨论