环球看点!百川智能发布开源中英文大模型,多个榜单评测成绩最佳
2023年6月15日,被称为「中国ChatGPT梦之队」的百川智能公司,推出了70 亿参数量的中英文预训练大模型——baichuan-7B。baichuan-7B不仅在C-Eval、AGIEval和Gaokao中文权威评测榜单上,以显著优势全面超过了ChatGLM-6B等其他大模型,并且在MMLU英文权威评测榜单上,大幅领先LLaMA-7B。
目前baichuan-7B大模型已在Hugging Face、Github以及Model Scope平台发布。
开源地址:
(资料图片)
Hugging Face:https://huggingface.co/baichuan-inc/baichuan-7B
Github:https://github.com/baichuan-inc/baichuan-7B
Model Scope:https://modelscope.cn/models/baichuan-inc/baichuan-7B/summary
多个最具影响力中文评估基准7B最佳
为了验证模型的各项能力,baichuan-7B在C-Eval、AGIEval和Gaokao三个最具影响力的中文评估基准进行了综合评估,并且均获得了优异成绩,它已经成为同等参数规模下中文表现最优秀的原生预训练模型。
在中文C-EVAL的评测中,baichuan-7B的综合评分达到了42.8分,超过了ChatGLM-6B的38.9分,甚至比某些参数规模更大的模型还要出色。
https://cevalbenchmark.com/static/leaderboard_zh.html(时间为2023-06-15)
C-Eval评测基准由上海交通大学、清华大学以及爱丁堡大学联合创建,是面向中文语言模型的综合考试评测集,覆盖了52个来自不同行业领域的学科。
在AGIEval的评测里,baichuan-7B综合评分达到34.4分,远超LLaMa-7B、Falcon-7B、Bloom-7B以及ChatGLM-6B等其他开源模型。
AGIEval评测基准由微软研究院发起,旨在全面评估基础模型在人类认知和问题解决相关任务上的能力,包含了中国的高考、司法考试,以及美国的SAT、LSAT、GRE和GMAT等20个公开且严谨的官方入学和职业资格考试。
在GAOKAO评测中,baichuan-7B的综合评分达到了36.2分,显著领先于同参数规模的各种其他预训练模型。
GAOKAO评测基准是复旦大学研究团队创建的评测框架,以中国高考题目作为数据集,用于测试大模型在中文语言理解和逻辑推理能力方面的表现。
MMLU英文评估基准表现大幅领先LLaMA-7B
baichuan-7B不仅在中文方面表现优异,在英文上表现同样亮眼。在MMLU的评测中baichuan-7B综合评分高达42.5分,大幅领先英文开源预训练模型LLaMA-7B的34.2分以及中文开源模型ChatGLM-6B的36.9分。
MMLU由加州大学伯克利分校等知名高校共同打造,集合了科学、工程、数学、人文、社会科学等领域的57个科目,主要目标是对模型的英文跨学科专业能力进行深入测试。其内容广泛,从初级水平一直涵盖到高级专业水平。
万亿优质数据、4K上下文窗口、高效稳定训练造就领先7B预训练模型
训练语料对大模型的训练结果至关重要。在构建预训练语料库方面,百川智能以高质量中文语料为基础,同时融合了优质的英文数据。在数据质量方面,通过质量模型对数据进行打分,对原始数据集进行篇章级和句子级的精确筛选;在内容多样性方面,利用自研超大规模局部敏感哈希聚类系统和语义聚类系统,对数据进行了多层次多粒度的聚类,最终构建了包含1.2万亿token的兼顾质量和多样性的预训练数据。相较于其他同参数规模的开源中文预训练模型,数据量提高了超过50%。
在万亿优质中英文数据的基础上,为了更好地提升训练效率,baichuan-7B深度整合了模型算子来加快计算流程,并针对任务负载和集群配置,自适应优化了模型并行策略以及重计算策略。通过高效的训练过程调度通信,baichuan-7B成功地实现了计算与通信的高效重叠,进而达到了超线性的训练加速,在千卡集群上训练吞吐达到180+Tflops的业界领先水平。
同时,已有的开源模型窗口长度在2K以内,对于一些长文本建模任务,如需要引入外部知识做搜索增强的场景,更长的处理长度有助于模型在训练与推理阶段捕获越多的上下文信息,2K的处理长度存在比较大的制约。baichuan-7B基于高效的attention算子优化实现了万级别超长动态窗口的扩张能力,本次开源的预训练模型开放了4K上下文窗口,使模型应用场景更加广泛。
此外,baichuan-7B还对模型训练流程进行了深度优化,采用了更科学且稳定的训练流程和超参数选择,使得 baichuan-7B模型的收敛速度大大提升。与同等参数规模的模型相比,baichuan-7B在困惑度(PPL)和训练损失(training loss)等关键性能指标上表现更加优秀。
免费可商用,清华北大率先使用助力研究
秉持开源精神,baichuan-7B代码采用Apache-2.0协议,模型权重采用了免费商用协议,只需进行简单登记即可免费商用。
baichuan-7B此次开源的内容十分丰富,包含了推理代码、INT4量化实现、微调代码,以及预训练模型的权重。其中,微调代码方便用户对模型进行调整和优化;推理代码与INT4量化实现则有助于开发者低成本地进行模型的部署和应用;预训练模型权重开源后,用户则可以直接使用预训练模型进行各种实验研究。
据了解,北京大学和清华大学两所顶尖大学已率先使用baichuan-7B模型推进相关研究工作,并计划在未来与百川智能深入合作,共同推动baichuan-7B模型的应用和发展。
清华大学互联网司法研究院院长、计算机系教授刘奕群认为, baichuan-7B模型在中文上的效果表现十分出色,它免费商用的开源方式展现出开放的态度,不仅贡献社区,也推动技术发展。团队计划基于baichuan-7B模型开展司法人工智能领域的相关研究。
北京大学人工智能研究院助理教授杨耀东认为,baichuan-7B模型的开源将对于中文基础语言模型的生态建设及学术研究产生重要推动作用,同时他也表示将持续关注相关领域探索,并且在中文大语言模型的安全和对齐上进行进一步深入研究。
百川智能CEO王小川表示:“本次开源模型的发布是百川智能成立2个月后的第一个里程碑,对百川智能而言是一个良好的开局。baichuan-7B模型,不仅能为中国的AGI事业添砖加瓦,也为世界大模型开源社区贡献了新的力量。”
标签:
推荐
- 环球看点!百川智能发布开源中英文大模型,多个榜单评测成绩最佳
- 一个总冠军,一个大合同!昔日湖人卧龙凤雏,如今却成人生赢家
- 建发致新现金流承压:毛利率、资产负债率差于同行,子公司被列入黑名单
- 海南加强学科类隐形变异培训防范治理 全面规范校外培训行为
- 全球观焦点:内蒙古工业大学2023年硕士研究生拟录取名单公示及相关工作安排
- 申华控股: 公司日常办公使用OA系统,最大程度减少审批和资料传阅过程中的纸张消耗 报资讯
- 环球通讯!tissot1853男士手表图_tissot1853男士手表
- 他三年内杀害67人,每次作案都是灭门!23起强奸,19起辱尸! 焦点速递
- 国家统计局:青年失业率处在高位,600多万人仍在求职
- 当前速讯:手机APP教程:小红书怎么创建新专辑 小红书APP创建新专辑的方法
- 天天快报!多喝牛奶有什么好处(每天坚持喝牛奶有哪些好处)
- 让乡亲们有书看、爱看书
- 世界观察:长信科技:公司为 Meta 提供最新款 VR Quest2 显示模组
- [碧蓝档案同人]有关普普通通的收尾人到达鸡窝出差那档子事 序.十八
- 2023年4月林肯飞行家销量多少? 在美系车中排名怎么样?
- 6月14日基金净值:华安沪港深外延增长灵活配置混合A最新净值4.337,涨0.86%|全球热议
- 新版盖伦征服者_新版盖伦-世界速看
- 上海崇明区爱心暑托班收费多少 今日观点
- 谁统一了三国建立了东晋_谁统一了三国 每日消息
- 世界今亮点!奥迪q5后排座椅放平再立起来视频(奥迪q5l后排座椅太直解决方案是什么?)
- 小便味道大是什么原因_男人小便味道重是什么原因 当前消息
- 广西柳州举办职业技能大赛 挖掘新能源汽车产业人才-全球热议
- 贝索斯53岁未婚妻穿抹胸裙约会,挺拔身姿有力量,褶皱手肘太显老 天天资讯
- 机房哪些设备辐射大(机房辐射大吗简介介绍)
- 白宫派人调停西海岸港口罢工,供应链混乱谁赢谁输?|环球最新
- 巴勒斯坦分析家谈总统访华:中国是巴人民信任的友好国家-天天讯息
- 征途银子任务怎么做(征途银子任务)-视讯
- 特朗普就“文件门”出庭否认37项指控,公开演讲称若再当选“将调查拜登家族” 全球最新
- 环球关注:湖北大悟县法院召开“清廉机关”创建活动动员大会
- 俄23岁男子游泳时被鲨鱼活吞 曾大喊“爸爸,救救我” 视焦点讯
- 连云港城建“19连云城建MTN001”7月4日付息,利率为4.85%_天天观天下
- 每日热闻!姆巴佩说梅西没有得到应有的尊重 这是一种耻辱
- 世界微资讯!高考生网上晒未打码准考证,警方:存在电诈隐患
- 环球观察:苹果手机主屏幕上的圆点怎么设置_苹果手机主屏幕的圆点在哪里设置
- 当前看点!青海海东市全方位筑牢医保基金安全底线
- 天天播报:绿色征途手游弓箭手怎么加点(绿色征途弓手加点)
- 【报资讯】小美野外生存,第59集,小美这里的塘虱鱼多到泛滥,老铁们有没有想来这里钓鱼...
- 世界新资讯:东星医疗拟市价五折向89名员工激励股权 营收净利考核指标低于2022年合理性存疑
- 世界最新:新的一天正能量文案
- 5月中国汽车产销持续增长_世界新要闻
- 天天精选!美国收到两个坏消息,中阿签署大单,俄巴原油贸易,用人民币结算
- 中国信通院:运用碳标识实现全环节全产业链碳数据可信
- 每平12.6万 没售楼处却连续3次日光 另一边两年“跳水”900万 深圳豪宅市场有点魔幻
- 生意社:6月14日国内顺丁橡胶市场早盘动态|焦点速看
- 天天快讯:计算机2级考试内容_计算机二级考什么内容
- 流产不到一个月又怀孕了_人流后一个月又怀孕了该怎么办|热消息
- 太阳系八大行星视频 太阳系八大行星排列顺序|世界独家
- 宝马sync是什么意思车上的空调(宝马sync是什么意思?)|最新快讯
- 热门中概股周二多数上涨 爱奇艺涨超7%,百度涨超6%,蔚来涨超5%-视点
- 当前动态:哔哩哔哩-W(09626.HK):6月13日南向资金增持210.9万股
- 长围巾的各种围法女(长围巾的各种围法)
- 井下队团支部传承雷锋精神实践活动
- 【新视野】皖能电力: 独立董事关于公司第十届董事会第二十五次会议相关事项的独立意见
- 教师风采丨郴州市十八中廖海斌:以赤子之心 行走教育之路|视点
- 阅读马拉松“开跑” 助力乡村儿童读书梦_当前热议
- 电力缺口第一大省,抢占万亿级风口
- 天天观察:双生灵探动漫樱花动漫_双生灵探动漫全集免费
- 重要通知!临泉县城乡居民基本养老保险已缴费年度提档补缴业务再次开放办理!-视焦点讯
- 微信零钱记录如何全部删除_微信零钱
- 101.31亿元!41144元!20467元!从数据看海口市琼山区高质量发展新答卷
- 快播:比亚迪李柯:美国目前不在考虑范围内,没必要进入每个市场
- 全球热头条丨6月13日浙江地区醋酸市场清淡运行
- 又一经济衰退的前兆?美国纸箱销售放缓
- 当前要闻:山度士手表维修点_山度士
- 精彩看点:知道他们有钱,但是没想到他们有钱到这种地步……
- 三局鏖战60分钟!石宇奇拒绝逆转险胜过关,印尼公开赛跻身16强
- 千钧一发的反义词成语_千钧一发的反义词
- 单人冒险策略游戏 《戈德》宣布8月8日发售 预购开启|环球热头条
- AIGC概念再度活跃;三安光电一度跳水跌超8%丨早市热点-焦点
- 香飘岛外!800万个儋州粽子远销京沪闽等16个省市_今日热闻
- 动态:魔兽世界8.1拳套能幻化什么武器(wow8.1拳套与单手武器相互幻化)
- 买到水龄16500年矿泉水?专家:不科学 水是流动的_天天快报
- 轩锋—黄金探底回升,原油一跌到底! 当前速看
- 全球今亮点!光伏行业协会凌晨回应:当事人只是协助调查 业内预计光伏产品对欧盟出口不受影响
- 新邵县开展消防安全技能培训暨消防应急演练
- 翻译:WTA上周回眸:法网斯娃+穆霍娃争锋;中国王谢女双夺冠上榜 世界热议
- 全球焦点!鲁西达尼亚国旗_关于鲁西达尼亚国旗简述
- 有寓意的文具店名字新颖的文具店名_文具店名字大全410个 好记的文具店名
- 热讯:过失损坏电力设备犯罪有哪些立案追诉标准?
- 蜘蛛卡通图片大全_蜘蛛卡通图片 环球快资讯
- 【天天聚看点】427dw驱动 427
- 清朝年号戏说_清朝年号 世界信息
- 【全球热闻】二季度依然承压,蔚来“降价”反击
- 焦点速讯:学考首日!临武县3465名考生共赴考场
- 微动态丨女子因家庭琐事欲轻生 绕城高速员工温言解心结
- 微软称仍致力于动视暴雪收购案,英美两国监管机构尚未批准
- 焦点播报:世界热头条丨吴玉华个人资料写真_吴玉华个人资料
- 交行董事长任德奇:扎实推进绿色金融与转型金融协同发展
- 中式家具坐垫:中式家具坐垫研究?
- 董庄社区_关于董庄社区的简介
- 插混SUV领域第二条“鲶鱼” 试驾吉利银河L7
- 每日讯息!晨丰科技(603685)6月12日主力资金净卖出82.79万元
- 球迷吐槽欧足联组织欧冠决赛不利:交通完全堵塞 场馆物价暴涨
- 环球即时:荔枝时节 荔运千里
- 间隔10多秒 滁新高速一段护栏被两车撞击-天天快消息
- 快资讯:96008企业网上银行_96008网上银行
- 短讯!北京:《电动自行车用锂离子动力电池组技术规范》于6月19日正式实施
- 怎么解除微信授权app一键支付功能_怎么解除微信授权app 快播报
- @高考生,考后这些时间点别错过! 视点
- 当前要闻:【光与夜之恋】当萧逸骗你深夜留宿(萧逸×你)小甜文
X 关闭
行业规章
X 关闭