DeepSeek V4 小说写作能力评测(一)
DeepSeek 于 2026 年 4 月 24 日正式发布了 V4 版本,具体见 DeepSeek 官方公告。
它支持了 Flash 和 Pro 两个版本的模型,都支持 1M 上下文。按照官方的说明:
-
Agent 能力大幅提高:相比前代模型,DeepSeek-V4-Pro 的 Agent 能力显著增强。在 Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平,并在其他 Agent 相关评测中同样表现优异。目前 DeepSeek-V4 已成为公司内部员工使用的 Agentic Coding 模型,据评测反馈使用体验优于 Sonnet 4.5,交付质量接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在一定差距。
-
丰富的世界知识:DeepSeek-V4-Pro 在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型 Gemini-Pro-3.1。
-
世界顶级推理性能:在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro 超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。
相比 DeepSeek-V4-Pro,DeepSeek-V4-Flash 在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下 V4-Flash 能够提供更加快捷、经济的 API 服务。
在 Agent 测评中,DeepSeek-V4-Flash 在简单任务上与 DeepSeek-V4-Pro 旗鼓相当,但在高难度任务上仍有差距。
那具体小说写作能力如何呢?我们通过在 FeelFish 中评测看看效果。
首先,我们在不挂载任何技能的情况下,使用专业辅助模式基于 DeepSeek-V4-Flash 模型打开思考模式,智能开篇小说《穿越大唐开饭馆》试试看。



首先可以看到指令遵循得还是挺好的,通过几轮对话之后,相比之前的版本,感觉会更加主动询问用户,而不是自己一股脑操作。

还能准确发现错误:

初始化出来的风格,没什么毛病,对话中提到的内容都包含了:

最后第一章创作完成,字数 2800 字,就这一点比 V3.2 要好!V3.2 通常都会创作到三四千字。我们来看看内容:
于航最后的记忆,是在秦岭深处一座废弃的古庙里。
当时他正举着手机对着镜头激情解说,身后是一口长满青苔的古井,弹幕里飘过一堆"于小厨注意安全""这地方看着好阴森"的留言。他刚想对着镜头来一句"越是这种地方,越有好食材",脚下一滑,整个人往后一仰——
然后就没有然后了。
再次醒来的时候,于航发现自己躺在一片密林里,阳光透过树叶的缝隙照在脸上,耳边鸟鸣啾啾,空气清新得不像话。
"我这是……被粉丝救了?"
他坐起来,拍了拍身上的泥土。手机还在手上,但屏幕已经碎了,怎么按都没反应。背包还在,里面装着他准备露营用的几包方便面、一个保温杯、一把多功能小刀,还有半包压缩饼干。
"得,这下视频素材是真够劲了。"
于航站起身,拍了拍裤子上的泥,开始往山下走。走了大概半个时辰,他看到了第一个活人——一个穿着粗布短衣的老农,牵着头牛在田埂上走。
"大爷!"于航热情地迎上去,"请问这附近最近的村子怎么走?"
老农抬起头,看了看他,眼神里写满了震惊和困惑。这也难怪,一个穿着白色T恤和牛仔裤的年轻人,满身泥土,出现在田埂上,搁谁都得懵。
"你……你是何人?"老农后退了两步,上下打量着于航。
于航一愣。大爷说的是普通话,但腔调有点怪,像是电视里那种古代剧的说话方式。不过好消息是——他能听懂。
"我是……路过的旅人,迷路了。"于航笑了笑,"大爷,这附近有城镇吗?"
"顺着这条路往东走二十里,就是长安城了。"
长……安?
于航的大脑宕机了三秒钟。
"大爷,请问现在是……哪个朝代?"
"朝代?"老农像看傻子一样看着他,"开元十九年,这你都不知道?"
开元十九年。唐玄宗。杨贵妃。李白。还有——安史之乱。
于航感觉自己整个人都不好了。
他花了整整一天的时间来消化这个事实:他穿越了。不是拍节目,不是做梦,是真真切切地从2025年穿越到了公元731年的大唐开元盛世。
好消息是:他穿越到了大唐最繁华的时期,这里是世界之都长安,机会遍地。
坏消息是:他身上只有一部碎了屏的手机、半包压缩饼干、一包方便面、一个保温杯和一把小刀。在现代他一文不值的那点东西,在古代更是连个馒头都换不来。
"行,既来之则安之。"于航站在长安城宏伟的城门前,深吸一口气,"人在江湖飘,哪能不挨刀。挨了刀也要笑着继续飘。"
长安城比他想象中还要壮观。高大的城墙绵延不绝,城门口排着长长的队伍,有牵着骆驼的胡商,有挑着担子的小贩,有骑着高头大马的公子哥,热闹非凡。
进城不需要门票,但要出示过所(身份证明)。于航正愁怎么混进去,前面一个商队跟守卫吵了起来,守卫们注意力被吸引过去,他趁乱低着头混进了城。
进了城,一股浓烈的市井气息扑面而来。街道两旁店铺林立,卖布匹的、卖首饰的、卖胡饼的,吆喝声此起彼伏。脚下是黄土夯实的路面,被踩得结结实实。来往行人衣着各异,有穿丝绸长袍的富商,有穿粗布短衣的平民,还有裹着头巾的胡人。
于航感觉自己像是走进了《长安十二时辰》的片场。
但眼下他顾不得欣赏这些。肚子"咕噜"叫了一声,提醒他一个很现实的问题——他饿了。
口袋里摸了一遍,除了一串现代钥匙和几张百元大钞,什么值钱的都没有。他蹲在路边,盯着来来往往的人群,脑子飞速转了起来。
美食博主穿越到古代,能干什么?
答案显而易见。
他观察了一下街上的小吃摊。卖胡饼的、卖蒸饼的、卖粥的,烹饪方式无非就是烤、蒸、煮。他闻了闻气味,调味也简单得很,基本上就是盐和酱的味道。
"炒菜还没普及啊……"于航舔了舔嘴唇。
唐代的铁锅冶炼技术还不够成熟,炒这种烹饪方式虽然已经出现,但远没有普及,大部分人还是用陶罐或铜釜煮东西吃。
而他,一个精通川鲁粤淮扬的现代美食博主,脑子里装着一整套铁锅快炒的技术体系和调味理念。这要是发挥出来,那简直就是对唐代味蕾的降维打击。
问题是,他连一口锅都没有。
于航在街上转悠了半天,终于在一个回收杂物的老汉那里捡到了一口被人丢弃的破铁锅。锅底有个小洞,边缘锈迹斑斑。他找了几块石头把锅敲了敲,又找了些泥土和碎瓦片磨了磨,勉勉强强把洞给堵上了。
他又问老汉要了几根竹签、一小罐盐、一小罐油——老汉看他可怜,答应他帮忙干半天活来换这些。于航二话不说,帮老汉卸了一整车柴火,累得腰都直不起来,但总算拿到了这些东西。
"万事开头难。"于航给自己打气。
他在西市边缘找了个角落,用石头垒了一个简易的灶台,捡了些干柴生上火。破锅架上去,倒了点油——油很金贵,唐代的植物油可不像现代那么便宜。
这时正是午时,街上人来人往。一个穿着粗布衣服、脸上脏兮兮的小女孩从他面前走过,手里攥着一枚铜钱,在一家胡饼摊前踌躇了半天,最后还是没舍得买。
于航心里一酸。他想起了自己小时候馋路边摊又买不起的感觉。
"小朋友,你过来。"他朝小女孩招了招手。
小女孩警惕地看着他,往后退了两步。
"别怕,我不是坏人。"于航笑了笑,"我请你吃点东西,不要钱。"
他从背包里拿出那包方便面——这是他身上唯一称得上"食材"的东西。他撕开包装,把面饼掰碎,又把调料包里的粉末倒出来——那里面有盐、味精、香辛料,对于唐代人来说简直是仙丹级别的调味品。
锅热了,油下去,香气四溢。于航把掰碎的方便面倒进去,快速翻炒。方便面里的淀粉在高温下迅速焦化,散发出浓郁的麦香。他又把调料粉撒进去,空气中顿时弥漫开一种让人唾液分泌的香味。
路过的行人纷纷停下脚步,好奇地望过来。
"这是什么味道?""好香啊……""从未闻过这种香味!"
于航用竹签挑起一小撮炒面,递到小女孩面前。小女孩犹豫了一下,接过来放进嘴里——
她的眼睛瞬间睁大了。
那是一种她从未体验过的味道。浓郁的咸鲜味在舌尖爆炸,香辛料的复合香气直冲天灵盖,炒过的面条外脆里软,每一口都是全新的口感体验。
"好……好好吃!"小女孩激动得声音都在发抖。
周围的围观群众骚动起来。一个穿着长衫的中年人走过来:"这位小郎君,你这卖的是什么?怎么卖?"
于航咧嘴一笑,手里继续翻炒着锅里的面。
"独家秘制炒面,三文钱一份。"
三文钱,一个胡饼的价格,不算贵。
"给我来一份!""我也要!""我先来的!"
转眼之间,于航的破锅前排起了一条长队。他背包里总共只有三包方便面,一包给了小女孩尝鲜,剩下两包很快就卖完了。
最后一算账,一共做了十份炒面,每份三文钱——三十文钱入账。
于航攥着那一小串铜钱,手都在抖。不是因为激动,是因为——这他娘的也太少了。三十文钱在长安城也就够吃几顿粗茶淡饭,连个像样的住处都租不起。
但话说回来,这是他穿越到大唐赚到的第一笔钱。
三十文钱。
于航把铜钱一枚一枚数清楚,揣进怀里,脸上露出了一个灿烂的笑容。
"行,开了个好头。"
他抬头看了看长安城灰蓝色的天空,深吸一口气。远处是一望无际的坊市屋顶,酒楼上的旗帜在风中猎猎作响,胡人的驼铃声从街角传来,整座城市像一个巨大的、沸腾的熔炉。
他于航,一个来自一千三百年后的美食博主,要在这个世界,搞点事情。
"老板,明天还来吗?"有个食客追上来问。
于航回头,咧嘴一笑:
"来。明天给你们整点更厉害的。"
他已经在心里盘算好了——明天,他要做一碗真正的蛋炒饭。那才是他征服长安味蕾的第一步。
整体逻辑是很通顺的,第一章关键道具“几包方便面”也前后呼应,但是结尾还是一贯出现了老毛病,开始抒情,看来还是要配备技能调教。
然后试了一下修改主角名称为“沈逸”,工具调用上没有问题,把相关文件都修改了:

初步来看 DeepSeek V4-Flash,不比 DeepSeek V3.2 差,调用工具,沟通对话,逻辑能力目前初步看都 OK,在价格比 DeepSeek V3.2 便宜近一半的情况下,必须冲!
接下来我们会继续评测 DeepSeek V4 Flash 和 Pro 在技能调用、长篇剧情一致性保持等能力上的情况。请关注我们后续的文章。