Browse Source

更改最新的cot方式问法

master
majiahui@haimaqingfan.com 3 weeks ago
parent
commit
011da31bf4
  1. 5
      articles_directory_predict.py
  2. 16
      articles_directory_predict_qikan_word.py
  3. 15
      articles_directory_predict_qikan_word_online.py
  4. 18
      articles_directory_predict_qikan_word_table_formula_kongzhi.py
  5. 28
      articles_directory_predict_word.py
  6. 28
      articles_directory_predict_word_online.py
  7. 38
      articles_directory_predict_word_table_formula_kongzhi.py

5
articles_directory_predict.py

@ -23,7 +23,8 @@ def get_host_ip():
chatgpt_url_predict = "http://{}:12000/predict".format(str(get_host_ip())) chatgpt_url_predict = "http://{}:12000/predict".format(str(get_host_ip()))
chatgpt_url_search = "http://{}:12000/search".format(str(get_host_ip())) chatgpt_url_search = "http://{}:12000/search".format(str(get_host_ip()))
# prompt = "<|role|>user<|says|>{}<|end|>\n<|role|>assistant<|says|>" # prompt = "<|role|>user<|says|>{}<|end|>\n<|role|>assistant<|says|>"
prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n" qwen_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n"
qwen_think_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n<think>\n\n</think>\n\n"
app = Flask(__name__) app = Flask(__name__)
app.config["JSON_AS_ASCII"] = False app.config["JSON_AS_ASCII"] = False
@ -165,7 +166,7 @@ def get_multiple_urls(urls):
def articles_directory(): def articles_directory():
text = request.json["texts"] # 获取用户query中的文本 例如"I love you" text = request.json["texts"] # 获取用户query中的文本 例如"I love you"
nums = request.json["nums"] nums = request.json["nums"]
text = prompt.format(text) text = qwen_think_prompt.format(text)
nums = int(nums) nums = int(nums)
input_data = [] input_data = []

16
articles_directory_predict_qikan_word.py

@ -7,6 +7,7 @@ import socket
import os import os
class log: class log:
def __init__(self): def __init__(self):
pass pass
@ -42,34 +43,37 @@ def get_host_ip():
chatgpt_url_predict = "http://{}:12000/predict".format(str(get_host_ip())) chatgpt_url_predict = "http://{}:12000/predict".format(str(get_host_ip()))
chatgpt_url_search = "http://{}:12000/search".format(str(get_host_ip())) chatgpt_url_search = "http://{}:12000/search".format(str(get_host_ip()))
qwen_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n"
qwen_think_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n<think>\n\n</think>\n\n"
prompt = { prompt = {
"mulu_title_Level_2_1": "<|im_start|>user\n任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_2_1": "任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题",
"mulu_title_Level_3_1": "<|im_start|>user\n任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_3_1": "任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中",
} }
nums_word_dict = { nums_word_dict = {
"3000": { "3000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "3", "title_1_nums": "3",
"title_2_nums": ["0","3"], "title_2_nums": ["0","3"],
"title_small_nums": ["3", "0","3"] "title_small_nums": ["3", "0","3"]
}, },
"5000": { "5000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "4", "title_1_nums": "4",
"title_2_nums": ["0","5"], "title_2_nums": ["0","5"],
"title_small_nums": ["4", "0","5"] "title_small_nums": ["4", "0","5"]
}, },
"8000": { "8000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "5", "title_1_nums": "5",
"title_2_nums": ["0", "6"], "title_2_nums": ["0", "6"],
"title_small_nums": ["5", "0", "6"] "title_small_nums": ["5", "0", "6"]
}, },
"10000": { "10000": {
"prompt": prompt["mulu_title_Level_3_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]),
"title_1_nums": "6", "title_1_nums": "6",
"title_2_nums": ["0", "5"], "title_2_nums": ["0", "5"],
"title_small_nums": ["6", "0", "5"], "title_small_nums": ["6", "0", "5"],

15
articles_directory_predict_qikan_word_online.py

@ -6,7 +6,6 @@ import requests
import socket import socket
import os import os
class log: class log:
def __init__(self): def __init__(self):
pass pass
@ -42,34 +41,36 @@ def get_host_ip():
chatgpt_url_predict = "http://{}:12001/predict".format(str(get_host_ip())) chatgpt_url_predict = "http://{}:12001/predict".format(str(get_host_ip()))
chatgpt_url_search = "http://{}:12001/search".format(str(get_host_ip())) chatgpt_url_search = "http://{}:12001/search".format(str(get_host_ip()))
qwen_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n"
qwen_think_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n<think>\n\n</think>\n\n"
prompt = { prompt = {
"mulu_title_Level_2_1": "<|im_start|>user\n任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_2_1": "任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题",
"mulu_title_Level_3_1": "<|im_start|>user\n任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_3_1": "任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中",
} }
nums_word_dict = { nums_word_dict = {
"3000": { "3000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "3", "title_1_nums": "3",
"title_2_nums": ["0","3"], "title_2_nums": ["0","3"],
"title_small_nums": ["3", "0","3"] "title_small_nums": ["3", "0","3"]
}, },
"5000": { "5000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "4", "title_1_nums": "4",
"title_2_nums": ["0","5"], "title_2_nums": ["0","5"],
"title_small_nums": ["4", "0","5"] "title_small_nums": ["4", "0","5"]
}, },
"8000": { "8000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "5", "title_1_nums": "5",
"title_2_nums": ["0", "6"], "title_2_nums": ["0", "6"],
"title_small_nums": ["5", "0", "6"] "title_small_nums": ["5", "0", "6"]
}, },
"10000": { "10000": {
"prompt": prompt["mulu_title_Level_3_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]),
"title_1_nums": "6", "title_1_nums": "6",
"title_2_nums": ["0", "5"], "title_2_nums": ["0", "5"],
"title_small_nums": ["6", "0", "5"], "title_small_nums": ["6", "0", "5"],

18
articles_directory_predict_qikan_word_table_formula_kongzhi.py

@ -44,34 +44,37 @@ def get_host_ip():
chatgpt_url_predict = "http://{}:12000/predict".format(str(get_host_ip())) chatgpt_url_predict = "http://{}:12000/predict".format(str(get_host_ip()))
chatgpt_url_search = "http://{}:12000/search".format(str(get_host_ip())) chatgpt_url_search = "http://{}:12000/search".format(str(get_host_ip()))
qwen_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n"
qwen_think_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n<think>\n\n</think>\n\n"
prompt = { prompt = {
"mulu_title_Level_2_1": "<|im_start|>user\n任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_2_1": "任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题",
"mulu_title_Level_3_1": "<|im_start|>user\n任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_3_1": "任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中",
} }
nums_word_dict = { nums_word_dict = {
"3000": { "3000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "3", "title_1_nums": "3",
"title_2_nums": ["0","3"], "title_2_nums": ["0","3"],
"title_small_nums": ["3", "0","3"] "title_small_nums": ["3", "0","3"]
}, },
"5000": { "5000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "4", "title_1_nums": "4",
"title_2_nums": ["0","5"], "title_2_nums": ["0","5"],
"title_small_nums": ["4", "0","5"] "title_small_nums": ["4", "0","5"]
}, },
"8000": { "8000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "5", "title_1_nums": "5",
"title_2_nums": ["0", "6"], "title_2_nums": ["0", "6"],
"title_small_nums": ["5", "0", "6"] "title_small_nums": ["5", "0", "6"]
}, },
"10000": { "10000": {
"prompt": prompt["mulu_title_Level_3_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]),
"title_1_nums": "6", "title_1_nums": "6",
"title_2_nums": ["0", "5"], "title_2_nums": ["0", "5"],
"title_small_nums": ["6", "0", "5"], "title_small_nums": ["6", "0", "5"],
@ -424,7 +427,8 @@ def biaogegongshi_kongzhi_prompt(title, mulu_list, table_and_formulas_list):
"".join(prompt_2_kongzhi), "".join(prompt_2_kongzhi),
prompt_biaogekongzhi["prompt3_multiple_tags"].format("&".join(lable_en), "&".join(lable_en)), prompt_biaogekongzhi["prompt3_multiple_tags"].format("&".join(lable_en), "&".join(lable_en)),
]) ])
prompt = "<|im_start|>user\n任务:公式和表格生成控制\n{}<|im_end|>\n<|im_start|>assistant\n".format(prompt) prompt = "任务:公式和表格生成控制\n{}".format(prompt)
prompt = qwen_think_prompt.format(prompt)
prompt_list.append(prompt) prompt_list.append(prompt)
return prompt_list return prompt_list

28
articles_directory_predict_word.py

@ -42,60 +42,62 @@ def get_host_ip():
chatgpt_url_predict = "http://{}:12000/predict".format(str(get_host_ip())) chatgpt_url_predict = "http://{}:12000/predict".format(str(get_host_ip()))
chatgpt_url_search = "http://{}:12000/search".format(str(get_host_ip())) chatgpt_url_search = "http://{}:12000/search".format(str(get_host_ip()))
qwen_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n"
qwen_think_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n<think>\n\n</think>\n\n"
prompt = { prompt = {
"mulu_title_Level_2": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_2": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题",
"mulu_title_Level_2_1": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_2_1": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题",
"mulu_title_Level_3": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_3": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题;三级标题个数适中",
"mulu_title_Level_3_1": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_3_1": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中",
"mulu_title_Level_3_2": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数越多越好<|im_end|>\n<|im_start|>assistant\n" "mulu_title_Level_3_2": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数越多越好"
} }
nums_word_dict = { nums_word_dict = {
"3000": { "3000": {
"prompt": prompt["mulu_title_Level_2"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2"]),
"title_1_nums": "3", "title_1_nums": "3",
"title_2_nums": ["2"], "title_2_nums": ["2"],
"title_small_nums": ["3", "2"] "title_small_nums": ["3", "2"]
}, },
"5000": { "5000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "3", "title_1_nums": "3",
"title_2_nums": ["2","4"], "title_2_nums": ["2","4"],
"title_small_nums": ["3", "2","4"] "title_small_nums": ["3", "2","4"]
}, },
"8000": { "8000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "4", "title_1_nums": "4",
"title_2_nums": ["2", "4"], "title_2_nums": ["2", "4"],
"title_small_nums": ["4", "2", "4"], "title_small_nums": ["4", "2", "4"],
}, },
"10000": { "10000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "6", "title_1_nums": "6",
"title_2_nums": ["2", "5"], "title_2_nums": ["2", "5"],
"title_small_nums": ["6", "2", "5"], "title_small_nums": ["6", "2", "5"],
}, },
"15000": { "15000": {
"prompt": prompt["mulu_title_Level_3_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]),
"title_1_nums": "5", "title_1_nums": "5",
"title_2_nums": ["2", "3"], "title_2_nums": ["2", "3"],
"title_small_nums": ["5", "2", "3"], "title_small_nums": ["5", "2", "3"],
}, },
"20000": { "20000": {
"prompt": prompt["mulu_title_Level_3_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]),
"title_1_nums": "6", "title_1_nums": "6",
"title_2_nums": ["2", "4"], "title_2_nums": ["2", "4"],
"title_small_nums": ["6", "2", "4"], "title_small_nums": ["6", "2", "4"],
}, },
"30000": { "30000": {
"prompt": prompt["mulu_title_Level_3_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]),
"title_1_nums": "7", "title_1_nums": "7",
"title_2_nums": ["3", "5"], "title_2_nums": ["3", "5"],
"title_small_nums": ["7", "3", "5"], "title_small_nums": ["7", "3", "5"],
}, },
"50000": { "50000": {
"prompt": prompt["mulu_title_Level_3_2"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_2"]),
"title_1_nums": "8", "title_1_nums": "8",
"title_2_nums": ["3", "8"], "title_2_nums": ["3", "8"],
"title_small_nums": ["8", "3", "8"], "title_small_nums": ["8", "3", "8"],

28
articles_directory_predict_word_online.py

@ -42,60 +42,62 @@ def get_host_ip():
chatgpt_url_predict = "http://{}:12001/predict".format(str(get_host_ip())) chatgpt_url_predict = "http://{}:12001/predict".format(str(get_host_ip()))
chatgpt_url_search = "http://{}:12001/search".format(str(get_host_ip())) chatgpt_url_search = "http://{}:12001/search".format(str(get_host_ip()))
qwen_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n"
qwen_think_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n<think>\n\n</think>\n\n"
prompt = { prompt = {
"mulu_title_Level_2": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_2": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题",
"mulu_title_Level_2_1": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_2_1": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题",
"mulu_title_Level_3": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_3": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题;三级标题个数适中",
"mulu_title_Level_3_1": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_3_1": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中",
"mulu_title_Level_3_2": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数越多越好<|im_end|>\n<|im_start|>assistant\n" "mulu_title_Level_3_2": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数越多越好"
} }
nums_word_dict = { nums_word_dict = {
"3000": { "3000": {
"prompt": prompt["mulu_title_Level_2"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2"]),
"title_1_nums": "3", "title_1_nums": "3",
"title_2_nums": ["2"], "title_2_nums": ["2"],
"title_small_nums": ["3", "2"] "title_small_nums": ["3", "2"]
}, },
"5000": { "5000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "3", "title_1_nums": "3",
"title_2_nums": ["2","4"], "title_2_nums": ["2","4"],
"title_small_nums": ["3", "2","4"] "title_small_nums": ["3", "2","4"]
}, },
"8000": { "8000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "4", "title_1_nums": "4",
"title_2_nums": ["2", "4"], "title_2_nums": ["2", "4"],
"title_small_nums": ["4", "2", "4"], "title_small_nums": ["4", "2", "4"],
}, },
"10000": { "10000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "6", "title_1_nums": "6",
"title_2_nums": ["2", "5"], "title_2_nums": ["2", "5"],
"title_small_nums": ["6", "2", "5"], "title_small_nums": ["6", "2", "5"],
}, },
"15000": { "15000": {
"prompt": prompt["mulu_title_Level_3_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]),
"title_1_nums": "5", "title_1_nums": "5",
"title_2_nums": ["2", "3"], "title_2_nums": ["2", "3"],
"title_small_nums": ["5", "2", "3"], "title_small_nums": ["5", "2", "3"],
}, },
"20000": { "20000": {
"prompt": prompt["mulu_title_Level_3_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]),
"title_1_nums": "6", "title_1_nums": "6",
"title_2_nums": ["2", "4"], "title_2_nums": ["2", "4"],
"title_small_nums": ["6", "2", "4"], "title_small_nums": ["6", "2", "4"],
}, },
"30000": { "30000": {
"prompt": prompt["mulu_title_Level_3_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]),
"title_1_nums": "7", "title_1_nums": "7",
"title_2_nums": ["3", "5"], "title_2_nums": ["3", "5"],
"title_small_nums": ["7", "3", "5"], "title_small_nums": ["7", "3", "5"],
}, },
"50000": { "50000": {
"prompt": prompt["mulu_title_Level_3_2"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_2"]),
"title_1_nums": "8", "title_1_nums": "8",
"title_2_nums": ["3", "8"], "title_2_nums": ["3", "8"],
"title_small_nums": ["8", "3", "8"], "title_small_nums": ["8", "3", "8"],

38
articles_directory_predict_word_table_formula_kongzhi.py

@ -42,15 +42,20 @@ def get_host_ip():
return ip return ip
chatgpt_url_predict = "http://{}:12000/predict".format(str(get_host_ip())) # chatgpt_url_predict = "http://{}:12000/predict".format(str(get_host_ip()))
chatgpt_url_search = "http://{}:12000/search".format(str(get_host_ip())) # chatgpt_url_search = "http://{}:12000/search".format(str(get_host_ip()))
chatgpt_url_predict = "http://{}:12000/predict".format("192.168.31.149")
chatgpt_url_search = "http://{}:12000/search".format("192.168.31.149")
qwen_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n"
qwen_think_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n<think>\n\n</think>\n\n"
prompt = { prompt = {
"mulu_title_Level_2": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_2": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题",
"mulu_title_Level_2_1": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_2_1": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题",
"mulu_title_Level_3": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_3": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题;三级标题个数适中",
"mulu_title_Level_3_1": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", "mulu_title_Level_3_1": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中",
"mulu_title_Level_3_2": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数越多越好<|im_end|>\n<|im_start|>assistant\n" "mulu_title_Level_3_2": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数越多越好"
} }
prompt_biaogekongzhi = { prompt_biaogekongzhi = {
@ -84,49 +89,49 @@ id_to_lable = {
nums_word_dict = { nums_word_dict = {
"3000": { "3000": {
"prompt": prompt["mulu_title_Level_2"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2"]),
"title_1_nums": "3", "title_1_nums": "3",
"title_2_nums": ["2"], "title_2_nums": ["2"],
"title_small_nums": ["3", "2"] "title_small_nums": ["3", "2"]
}, },
"5000": { "5000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "3", "title_1_nums": "3",
"title_2_nums": ["2","4"], "title_2_nums": ["2","4"],
"title_small_nums": ["3", "2","4"] "title_small_nums": ["3", "2","4"]
}, },
"8000": { "8000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "4", "title_1_nums": "4",
"title_2_nums": ["2", "4"], "title_2_nums": ["2", "4"],
"title_small_nums": ["4", "2", "4"], "title_small_nums": ["4", "2", "4"],
}, },
"10000": { "10000": {
"prompt": prompt["mulu_title_Level_2_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]),
"title_1_nums": "6", "title_1_nums": "6",
"title_2_nums": ["2", "5"], "title_2_nums": ["2", "5"],
"title_small_nums": ["6", "2", "5"], "title_small_nums": ["6", "2", "5"],
}, },
"15000": { "15000": {
"prompt": prompt["mulu_title_Level_3_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]),
"title_1_nums": "5", "title_1_nums": "5",
"title_2_nums": ["2", "3"], "title_2_nums": ["2", "3"],
"title_small_nums": ["5", "2", "3"], "title_small_nums": ["5", "2", "3"],
}, },
"20000": { "20000": {
"prompt": prompt["mulu_title_Level_3_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]),
"title_1_nums": "6", "title_1_nums": "6",
"title_2_nums": ["2", "4"], "title_2_nums": ["2", "4"],
"title_small_nums": ["6", "2", "4"], "title_small_nums": ["6", "2", "4"],
}, },
"30000": { "30000": {
"prompt": prompt["mulu_title_Level_3_1"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]),
"title_1_nums": "7", "title_1_nums": "7",
"title_2_nums": ["3", "5"], "title_2_nums": ["3", "5"],
"title_small_nums": ["7", "3", "5"], "title_small_nums": ["7", "3", "5"],
}, },
"50000": { "50000": {
"prompt": prompt["mulu_title_Level_3_2"], "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_2"]),
"title_1_nums": "8", "title_1_nums": "8",
"title_2_nums": ["3", "8"], "title_2_nums": ["3", "8"],
"title_small_nums": ["8", "3", "8"], "title_small_nums": ["8", "3", "8"],
@ -450,7 +455,8 @@ def biaogegongshi_kongzhi_prompt(title, mulu_list, table_and_formulas_list):
"".join(prompt_2_kongzhi), "".join(prompt_2_kongzhi),
prompt_biaogekongzhi["prompt3_multiple_tags"].format("&".join(lable_en), "&".join(lable_en)), prompt_biaogekongzhi["prompt3_multiple_tags"].format("&".join(lable_en), "&".join(lable_en)),
]) ])
prompt = "<|im_start|>user\n任务:公式和表格生成控制\n{}<|im_end|>\n<|im_start|>assistant\n".format(prompt) prompt = "任务:公式和表格生成控制\n{}".format(prompt)
prompt = qwen_think_prompt.format(prompt)
prompt_list.append(prompt) prompt_list.append(prompt)
return prompt_list return prompt_list

Loading…
Cancel
Save