2026.6.27-OpenAI发布GPT 5.6

1、OpenAI发布GPT 5.6 5.6 Sol:Mythos级别的模型,但是速度比Mythos慢。仅对少量机构开放。 5.6 Terra:性能接近5.5,但是价格更便宜。OpenAI惯用伎俩了,不是为了模型升级,而是为了省钱。 5.6 Luna:快速模型,适合简单任务。 顶级模型用不上,能用上的基本没提升。 官方介绍:https://openai.com/index/previewing-gpt-5-6-sol/

2、DSpark:DeepSeek的半自回归投机解码框架,让V4推理速度提升60%–85% · 投机解码(Speculative Decoding)中,并行草稿器虽然快但质量随位置衰减,自回归草稿器质量稳定但速度受限。DSpark用"半自回归"架构同时拿到两者的优势 · 固定长度验证在高并发场景下浪费大量计算资源。DSpark引入置信度调度,根据实时负载动态裁剪验证长度,把算力用在刀刃上 · 已部署到DeepSeek-V4生产环境,替代原有的MTP-1方案,生成速度提升60%–85% 模型:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-DSpark

3、谷歌发布端侧推理提速方法 将多token预测(MTP)改装到已有模型上,无需重新训练基座模型即可大幅加速端侧推理,核心思路是在Gemini Nano v3的最后几层接一个轻量级Transformer头,利用主模型已有的内部表征来"猜"后续多个token,再由主模型并行验证。已在Pixel 9和10系列上线,AI通知摘要和Proofread等功能获得显著提速。 博客:https://research.google/blog/accelerating-gemini-nano-models-on-pixel-with-frozen-multi-token-prediction/

我开源的Skill 1)原生PPT Skill。适用于任何模型和Agent,使用内置PPT模板生成豪华、可编辑的PPT。 Github:https://github.com/GordenSun/GordenPPTSkill

2)图片PPT转可编辑PPTX文档。可以把GPT和Banana生成的图片还原为可编辑的PPTX文档。 Github:https://github.com/GordenSun/GordenSuperPPTSkills

我的公众号:AI加速派 分享国内可以直接操作的前沿教程和AI资讯。

image.png