Llama中文大模型-模型量化

02-28 阅读 0评论

对中文微调的模型参数进行了量化，方便以更少的计算资源运行。目前已经在Hugging Face上传了13B中文微调模型FlagAlpha/Llama2-Chinese-13b-Chat的4bit压缩版本FlagAlpha/Llama2-Chinese-13b-Chat-4bit，具体调用方式如下：

$Llama中文大模型-模型量化,Llama中文大模型-模型量化,词库加载错误:未能找到文件“C:\Users\Administrator\Desktop\火车头9.8破解版\Configuration\Dict_Stopwords.txt”。,GPT,Chat,大模型,第1张$

（图片来源网络，侵删）

环境准备：

pip install git+https://github.com/PanQiWei/AutoGPTQ.git

from transformers import AutoTokenizer
from auto_gptq import AutoGPTQForCausalLM
model = AutoGPTQForCausalLM.from_quantized('FlagAlpha/Llama2-Chinese-13b-Chat-4bit', device="cuda:0")
tokenizer = AutoTokenizer.from_pretrained('FlagAlpha/Llama2-Chinese-13b-Chat-4bit',use_fast=False)
input_ids = tokenizer(['Human: 怎么登上火星\nAssistant: '], return_tensors="pt",add_special_tokens=False).input_ids.to('cuda')        
generate_input = {
    "input_ids":input_ids,
    "max_new_tokens":512,
    "do_sample":True,
    "top_k":50,
    "top_p":0.95,
    "temperature":0.3,
    "repetition_penalty":1.3,
    "eos_token_id":tokenizer.eos_token_id,
    "bos_token_id":tokenizer.bos_token_id,
    "pad_token_id":tokenizer.pad_token_id
}
generate_ids  = model.generate(**generate_input)
text = tokenizer.decode(generate_ids[0])
print(text)

$Llama中文大模型-模型量化,Llama中文大模型-模型量化,词库加载错误:未能找到文件“C:\Users\Administrator\Desktop\火车头9.8破解版\Configuration\Dict_Stopwords.txt”。,GPT,Chat,大模型,第2张$

（图片来源网络，侵删）

$Llama中文大模型-模型量化,Llama中文大模型-模型量化,词库加载错误:未能找到文件“C:\Users\Administrator\Desktop\火车头9.8破解版\Configuration\Dict_Stopwords.txt”。,GPT,Chat,大模型,第3张$

（图片来源网络，侵删）

相关阅读：

1、本地运行feishu-chatgpt项目结合内网穿透实现无公网IP远程访问

2、【xinference】（11）：在compshare上使用4090D运行xinf和chatgpt-web，部署大模型GLM-4-9B大模型，占用显存18G，速度不错，也挺智能的。

3、ChatTTS webUI & API：ChatTTS本地网页界面的高效文本转语音、同时支持API调用！

4、ChatTTS webUI & API：ChatTTS本地网页界面的高效文本转语音、同时支持API调用！

5、ChatTTS webUI & API：ChatTTS本地网页界面的高效文本转语音、同时支持API调用！

免责声明

本网站所收集的部分公开资料来源于AI生成和互联网，转载的目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

Llama中文大模型-模型量化

相关阅读

一体式水冷主机怎么看液位图(一体式水冷主机怎么看液位图纸)

中维世纪硬盘怎么连接电脑主机(中维世纪网络硬盘录像机怎么连接电脑)

xbox主机怎么绑定账号登录(xbox主机怎么绑定账号登录游戏)

笔记本和电脑主机怎么连接一个显示器上(笔记本和电脑主机怎么连接一个显示器上的)

发表评论取消回复

还没有评论，来说两句吧...

目录[+]