每日消费电子观察
00:00 · Apr 28, 2024 · Sun
阿里巴巴开源 1100 亿参数 Qwen1.5-110B 模型,与 Meta Llama3-70B 相媲美 - IT之家
https://www.ithome.com/0/764/662.htm
Ithome
阿里巴巴开源 1100 亿参数 Qwen1.5-110B 模型,与 Meta Llama3-70B 相媲美 - IT之家
据介绍,Qwen1.5-110B 与其他 Qwen1.5 模型相似,采用了相同的 Transformer 解码器架构。它包含了分组查询注意力(GQA),在模型推理时更加高效。该模型支持 32K tokens 的上下文长度,同时它仍然是多语言的,支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。
Home
竹新社
参考消息
南华早报
风向旗参考快讯
每日消费电子观察
Find me in
Telegram