Llama2 Chinese – 号称是目前最好的中文 Llama 大模型
https://github.com/FlagAlpha/Llama2-Chinese
?体验地址
?根据介绍,「Llama2-Chinese-13B」是基于 200B 中文语料从头训练的,所以它从模型底层实现了 Llama2 中文能力的优化和提升
并且它的中文训练数据源非常广泛,比如经过筛选地互联网上公开的中文网络数据、中文维基百科、中文悟道开源的 200G 数据等等
?众所周知,Llama2 是目前最强的开源大模型,但是中文预训练数据的比例仅占 0.13% ,所以对中文支持比较不友好。幸运的是因为其是开源的,所以「Llama2-Chinese-13B」应运而生
?如有兴趣,你可以自行对比原版与中文版的差异