Llama2 Chinese - 号称是目前最好的中文 Llama 大模型

Llama2 Chinese – 号称是目前最好的中文 Llama 大模型

?体验地址

?根据介绍，「Llama2-Chinese-13B」是基于 200B 中文语料从头训练的，所以它从模型底层实现了 Llama2 中文能力的优化和提升

并且它的中文训练数据源非常广泛，比如经过筛选地互联网上公开的中文网络数据、中文维基百科、中文悟道开源的 200G 数据等等

?众所周知，Llama2 是目前最强的开源大模型，但是中文预训练数据的比例仅占 0.13% ，所以对中文支持比较不友好。幸运的是因为其是开源的，所以「Llama2-Chinese-13B」应运而生

?如有兴趣，你可以自行对比原版与中文版的差异