国产彼氏朝桐光ntr,欧美精品一区三区,中文字幕人妻美腿丝袜乱一区三区

在文章Firefly(流螢): 中文對話式大語言模型中，中文我們介紹了關于Firefly(流螢)項目的對話工作，并且分享了我們訓練的模型firefly-1b4模型。這是中文Firefly項目開源的第一個模型，雖然取得了還不錯的對話效果，但無論是模型訓練數據還是模型參數量，都還有很大的中文優化空間。

中文對話式大語言模型Firefly

所以，對話在firefly-1b4實驗的模型基礎上，我們對訓練數據進行清洗，中文并且增加了數據量，對話得到210萬數據，模型并用它訓練得到了firefly-2b6模型。中文

在本文中，對話我們將對該模型進行分享和介紹。模型與firefly-1b4相比，firefly-2b6的代碼生成能力取得了較大的進步，并且在古詩詞生成、對聯、作文、開放域生成等方面也有不錯的提升。

firefly-1b4和firefly-2b6的訓練配置如下表所示。無論是訓練數據量，還是訓練步數，firefly-2b6都更加充分。

參數	firefly-1b4	firefly-2b6
batch size	16	8
learning rate	3e-5	3e-5
warmup step	3000	3000
lr schedule	cosine	cosine
max length	512	512
training step	90k	260k
訓練集規模	160萬	210萬

項目地址：

https://github.com/yangjianxin1/Firefly

模型權重鏈接見文末。

模型使用

使用如下代碼即可使用模型：

from transformersimport BloomTokenizerFast, BloomForCausalLMdevice = 'cuda'path = 'YeungNLP/firefly-2b6'tokenizer = BloomTokenizerFast.from_pretrained(path)model = BloomForCausalLM.from_pretrained(path)model.eval()model = model.to(device)text = input('User：')while True:    text = '{ }'.format(text)    input_ids = tokenizer(text, return_tensors="pt").input_ids    input_ids = input_ids.to(device)outputs=model.generate(input_ids,max_new_tokens=250,do_sample=True,top_p=0.7,temperature=0.35,                             repetition_penalty=1.2, eos_token_id=tokenizer.eos_token_id)    rets = tokenizer.batch_decode(outputs)    output = rets[0].strip().replace(text, "").replace('', "")    print("Firefly：{ }".format(output))    text = input('User：')

代碼生成

盡管在訓練集中，代碼的數據量不多，但令人驚喜的是，firefly-2b6已經具備一定的代碼生成能力。

在筆者的實測中，對于一些編程題，firefly-2b6生成的代碼可以做到無需修改，直接運行成功，并且得到正確的答案。下面將展示一些編程題的生成例子。

示例1：幫我用python寫一個冒泡排序算法。