北京时间凌晨4点钟Openai举行一个14分钟左右的直播活动,发布最新大模型GPT-4.5,OpenAI在新闻稿中表示,这是公司有史以来最大、最好的聊天模型,在计算效率上较GPT-4提升超过10倍,我们看看,同GPT-4o相比较,具体有哪些改变和提升。
在知识准确性和幻觉率方面:GPT - 4.5在AIME2024基准测试里得了36.7%,GPT - 4o才9.3%,可见GPT - 4.5知识准确性提升很大。像“人类的第一种语言是什么”这种问题,GPT - 4.5会诚实说这是未解之谜,幻觉答案减少了。
世界知识和理解上:GPT - 4.5通过多种优化有了更广知识和更深理解能力,不再乱说了,可靠性提高。
人类偏好与对话能力:人类偏好测试里GPT - 4.5更受欢迎。它能更好理解人类想法,情商更高地对话,对微妙线索和隐含期望把握更细腻,审美直觉和创造力更强。
技术进步方面:GPT - 4.5有新的可扩展技术,能用小模型数据训练出强大模型,可引导性、细节理解和自然对话能力都提升了。
推理与应用能力:GPT - 4.5虽不是专门的推理模型,但简单有挑战的知识问题能回答得不错,代码编写、物理问题解决也还行,不过有些地方比不上Claude 3.7这种专门的推理模型。
价格:GPT - 4.5使用成本比GPT - 4o高多了。每百万输入输出费用,GPT - 4.5是75美元,GPT - 4o是3美元;输出费用GPT - 4.5是150美元,GPT - 4o是15美元,GPT - 4.5成本是GPT - 4o的好几倍。
功能与限制方面:GPT - 4.5功能更多,像搜索、文件和图像上传、画布写作和编码都能支持,但不支持语音、视频和屏幕共享等多模态功能,这方面比GPT - 4o差些。
下一篇: 最后一页
tortoise-tts学习资料汇总 - 高质量多声音TTS系统
2024-12-31
PaddleSpeech入门学习资料汇总 - 开源语音AI工具包
2025-01-02
pot-desktop使用指南 - 跨平台划词翻译和OCR软件
2025-01-02
understand-prompt学习资料汇总 - AI助手的探索与应用
2025-01-02
GPT4All学习资源汇总 - 在本地设备上运行大型语言模型
2025-01-02
2025-01-02
wechat-bot入门指南 - 基于ChatGPT的微信聊天机器人
2025-01-02
Cheetah - AI助手学习资料汇总 - Mac应用助力远程技术面试
2025-01-02
AI代码翻译器学习资料汇总 - 使用AI将代码从一种语言翻译成另一种语言
2025-01-02