From 011da31bf47d5647c6ec3317bd7b68efa65d185e Mon Sep 17 00:00:00 2001 From: "majiahui@haimaqingfan.com" Date: Tue, 27 May 2025 17:49:25 +0800 Subject: [PATCH] =?UTF-8?q?=E6=9B=B4=E6=94=B9=E6=9C=80=E6=96=B0=E7=9A=84co?= =?UTF-8?q?t=E6=96=B9=E5=BC=8F=E9=97=AE=E6=B3=95?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- articles_directory_predict.py | 5 +-- articles_directory_predict_qikan_word.py | 16 +++++---- articles_directory_predict_qikan_word_online.py | 15 +++++---- ...ory_predict_qikan_word_table_formula_kongzhi.py | 18 ++++++---- articles_directory_predict_word.py | 28 ++++++++-------- articles_directory_predict_word_online.py | 28 ++++++++-------- ...directory_predict_word_table_formula_kongzhi.py | 38 +++++++++++++--------- 7 files changed, 84 insertions(+), 64 deletions(-) diff --git a/articles_directory_predict.py b/articles_directory_predict.py index 0113b9b..fb9274f 100644 --- a/articles_directory_predict.py +++ b/articles_directory_predict.py @@ -23,7 +23,8 @@ def get_host_ip(): chatgpt_url_predict = "http://{}:12000/predict".format(str(get_host_ip())) chatgpt_url_search = "http://{}:12000/search".format(str(get_host_ip())) # prompt = "<|role|>user<|says|>{}<|end|>\n<|role|>assistant<|says|>" -prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n" +qwen_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n" +qwen_think_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n\n\n\n\n" app = Flask(__name__) app.config["JSON_AS_ASCII"] = False @@ -165,7 +166,7 @@ def get_multiple_urls(urls): def articles_directory(): text = request.json["texts"] # 获取用户query中的文本 例如"I love you" nums = request.json["nums"] - text = prompt.format(text) + text = qwen_think_prompt.format(text) nums = int(nums) input_data = [] diff --git a/articles_directory_predict_qikan_word.py b/articles_directory_predict_qikan_word.py index 61416b4..a784e6d 100644 --- a/articles_directory_predict_qikan_word.py +++ b/articles_directory_predict_qikan_word.py @@ -7,6 +7,7 @@ import socket import os + class log: def __init__(self): pass @@ -42,34 +43,37 @@ def get_host_ip(): chatgpt_url_predict = "http://{}:12000/predict".format(str(get_host_ip())) chatgpt_url_search = "http://{}:12000/search".format(str(get_host_ip())) +qwen_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n" +qwen_think_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n\n\n\n\n" + prompt = { - "mulu_title_Level_2_1": "<|im_start|>user\n任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题<|im_end|>\n<|im_start|>assistant\n", - "mulu_title_Level_3_1": "<|im_start|>user\n任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", + "mulu_title_Level_2_1": "任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题", + "mulu_title_Level_3_1": "任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中", } nums_word_dict = { "3000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "3", "title_2_nums": ["0","3"], "title_small_nums": ["3", "0","3"] }, "5000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "4", "title_2_nums": ["0","5"], "title_small_nums": ["4", "0","5"] }, "8000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "5", "title_2_nums": ["0", "6"], "title_small_nums": ["5", "0", "6"] }, "10000": { - "prompt": prompt["mulu_title_Level_3_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]), "title_1_nums": "6", "title_2_nums": ["0", "5"], "title_small_nums": ["6", "0", "5"], diff --git a/articles_directory_predict_qikan_word_online.py b/articles_directory_predict_qikan_word_online.py index 2a7ab0d..8460a0b 100644 --- a/articles_directory_predict_qikan_word_online.py +++ b/articles_directory_predict_qikan_word_online.py @@ -6,7 +6,6 @@ import requests import socket import os - class log: def __init__(self): pass @@ -42,34 +41,36 @@ def get_host_ip(): chatgpt_url_predict = "http://{}:12001/predict".format(str(get_host_ip())) chatgpt_url_search = "http://{}:12001/search".format(str(get_host_ip())) +qwen_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n" +qwen_think_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n\n\n\n\n" prompt = { - "mulu_title_Level_2_1": "<|im_start|>user\n任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题<|im_end|>\n<|im_start|>assistant\n", - "mulu_title_Level_3_1": "<|im_start|>user\n任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", + "mulu_title_Level_2_1": "任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题", + "mulu_title_Level_3_1": "任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中", } nums_word_dict = { "3000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "3", "title_2_nums": ["0","3"], "title_small_nums": ["3", "0","3"] }, "5000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "4", "title_2_nums": ["0","5"], "title_small_nums": ["4", "0","5"] }, "8000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "5", "title_2_nums": ["0", "6"], "title_small_nums": ["5", "0", "6"] }, "10000": { - "prompt": prompt["mulu_title_Level_3_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]), "title_1_nums": "6", "title_2_nums": ["0", "5"], "title_small_nums": ["6", "0", "5"], diff --git a/articles_directory_predict_qikan_word_table_formula_kongzhi.py b/articles_directory_predict_qikan_word_table_formula_kongzhi.py index 36529f8..a936c72 100644 --- a/articles_directory_predict_qikan_word_table_formula_kongzhi.py +++ b/articles_directory_predict_qikan_word_table_formula_kongzhi.py @@ -44,34 +44,37 @@ def get_host_ip(): chatgpt_url_predict = "http://{}:12000/predict".format(str(get_host_ip())) chatgpt_url_search = "http://{}:12000/search".format(str(get_host_ip())) +qwen_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n" +qwen_think_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n\n\n\n\n" + prompt = { - "mulu_title_Level_2_1": "<|im_start|>user\n任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题<|im_end|>\n<|im_start|>assistant\n", - "mulu_title_Level_3_1": "<|im_start|>user\n任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", + "mulu_title_Level_2_1": "任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题", + "mulu_title_Level_3_1": "任务:生成目录\n请帮我生成一个期刊论文的目录,论文题目是“%s”,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中", } nums_word_dict = { "3000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "3", "title_2_nums": ["0","3"], "title_small_nums": ["3", "0","3"] }, "5000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "4", "title_2_nums": ["0","5"], "title_small_nums": ["4", "0","5"] }, "8000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "5", "title_2_nums": ["0", "6"], "title_small_nums": ["5", "0", "6"] }, "10000": { - "prompt": prompt["mulu_title_Level_3_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]), "title_1_nums": "6", "title_2_nums": ["0", "5"], "title_small_nums": ["6", "0", "5"], @@ -424,7 +427,8 @@ def biaogegongshi_kongzhi_prompt(title, mulu_list, table_and_formulas_list): ",".join(prompt_2_kongzhi), prompt_biaogekongzhi["prompt3_multiple_tags"].format("&".join(lable_en), "&".join(lable_en)), ]) - prompt = "<|im_start|>user\n任务:公式和表格生成控制\n{}<|im_end|>\n<|im_start|>assistant\n".format(prompt) + prompt = "任务:公式和表格生成控制\n{}".format(prompt) + prompt = qwen_think_prompt.format(prompt) prompt_list.append(prompt) return prompt_list diff --git a/articles_directory_predict_word.py b/articles_directory_predict_word.py index 1b10255..9aa631d 100644 --- a/articles_directory_predict_word.py +++ b/articles_directory_predict_word.py @@ -42,60 +42,62 @@ def get_host_ip(): chatgpt_url_predict = "http://{}:12000/predict".format(str(get_host_ip())) chatgpt_url_search = "http://{}:12000/search".format(str(get_host_ip())) +qwen_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n" +qwen_think_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n\n\n\n\n" prompt = { - "mulu_title_Level_2": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题<|im_end|>\n<|im_start|>assistant\n", - "mulu_title_Level_2_1": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题<|im_end|>\n<|im_start|>assistant\n", - "mulu_title_Level_3": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", - "mulu_title_Level_3_1": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", - "mulu_title_Level_3_2": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数越多越好<|im_end|>\n<|im_start|>assistant\n" + "mulu_title_Level_2": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题", + "mulu_title_Level_2_1": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题", + "mulu_title_Level_3": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题;三级标题个数适中", + "mulu_title_Level_3_1": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中", + "mulu_title_Level_3_2": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数越多越好" } nums_word_dict = { "3000": { - "prompt": prompt["mulu_title_Level_2"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2"]), "title_1_nums": "3", "title_2_nums": ["2"], "title_small_nums": ["3", "2"] }, "5000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "3", "title_2_nums": ["2","4"], "title_small_nums": ["3", "2","4"] }, "8000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "4", "title_2_nums": ["2", "4"], "title_small_nums": ["4", "2", "4"], }, "10000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "6", "title_2_nums": ["2", "5"], "title_small_nums": ["6", "2", "5"], }, "15000": { - "prompt": prompt["mulu_title_Level_3_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]), "title_1_nums": "5", "title_2_nums": ["2", "3"], "title_small_nums": ["5", "2", "3"], }, "20000": { - "prompt": prompt["mulu_title_Level_3_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]), "title_1_nums": "6", "title_2_nums": ["2", "4"], "title_small_nums": ["6", "2", "4"], }, "30000": { - "prompt": prompt["mulu_title_Level_3_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]), "title_1_nums": "7", "title_2_nums": ["3", "5"], "title_small_nums": ["7", "3", "5"], }, "50000": { - "prompt": prompt["mulu_title_Level_3_2"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_2"]), "title_1_nums": "8", "title_2_nums": ["3", "8"], "title_small_nums": ["8", "3", "8"], diff --git a/articles_directory_predict_word_online.py b/articles_directory_predict_word_online.py index e6fc539..a0227a3 100644 --- a/articles_directory_predict_word_online.py +++ b/articles_directory_predict_word_online.py @@ -42,60 +42,62 @@ def get_host_ip(): chatgpt_url_predict = "http://{}:12001/predict".format(str(get_host_ip())) chatgpt_url_search = "http://{}:12001/search".format(str(get_host_ip())) +qwen_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n" +qwen_think_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n\n\n\n\n" prompt = { - "mulu_title_Level_2": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题<|im_end|>\n<|im_start|>assistant\n", - "mulu_title_Level_2_1": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题<|im_end|>\n<|im_start|>assistant\n", - "mulu_title_Level_3": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", - "mulu_title_Level_3_1": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", - "mulu_title_Level_3_2": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数越多越好<|im_end|>\n<|im_start|>assistant\n" + "mulu_title_Level_2": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题", + "mulu_title_Level_2_1": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题", + "mulu_title_Level_3": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题;三级标题个数适中", + "mulu_title_Level_3_1": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中", + "mulu_title_Level_3_2": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数越多越好" } nums_word_dict = { "3000": { - "prompt": prompt["mulu_title_Level_2"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2"]), "title_1_nums": "3", "title_2_nums": ["2"], "title_small_nums": ["3", "2"] }, "5000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "3", "title_2_nums": ["2","4"], "title_small_nums": ["3", "2","4"] }, "8000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "4", "title_2_nums": ["2", "4"], "title_small_nums": ["4", "2", "4"], }, "10000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "6", "title_2_nums": ["2", "5"], "title_small_nums": ["6", "2", "5"], }, "15000": { - "prompt": prompt["mulu_title_Level_3_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]), "title_1_nums": "5", "title_2_nums": ["2", "3"], "title_small_nums": ["5", "2", "3"], }, "20000": { - "prompt": prompt["mulu_title_Level_3_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]), "title_1_nums": "6", "title_2_nums": ["2", "4"], "title_small_nums": ["6", "2", "4"], }, "30000": { - "prompt": prompt["mulu_title_Level_3_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]), "title_1_nums": "7", "title_2_nums": ["3", "5"], "title_small_nums": ["7", "3", "5"], }, "50000": { - "prompt": prompt["mulu_title_Level_3_2"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_2"]), "title_1_nums": "8", "title_2_nums": ["3", "8"], "title_small_nums": ["8", "3", "8"], diff --git a/articles_directory_predict_word_table_formula_kongzhi.py b/articles_directory_predict_word_table_formula_kongzhi.py index 9843e3d..2d602f2 100644 --- a/articles_directory_predict_word_table_formula_kongzhi.py +++ b/articles_directory_predict_word_table_formula_kongzhi.py @@ -42,15 +42,20 @@ def get_host_ip(): return ip -chatgpt_url_predict = "http://{}:12000/predict".format(str(get_host_ip())) -chatgpt_url_search = "http://{}:12000/search".format(str(get_host_ip())) +# chatgpt_url_predict = "http://{}:12000/predict".format(str(get_host_ip())) +# chatgpt_url_search = "http://{}:12000/search".format(str(get_host_ip())) +chatgpt_url_predict = "http://{}:12000/predict".format("192.168.31.149") +chatgpt_url_search = "http://{}:12000/search".format("192.168.31.149") + +qwen_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n" +qwen_think_prompt = "<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n\n\n\n\n" prompt = { - "mulu_title_Level_2": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题<|im_end|>\n<|im_start|>assistant\n", - "mulu_title_Level_2_1": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题<|im_end|>\n<|im_start|>assistant\n", - "mulu_title_Level_3": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", - "mulu_title_Level_3_1": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中<|im_end|>\n<|im_start|>assistant\n", - "mulu_title_Level_3_2": "<|im_start|>user\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数越多越好<|im_end|>\n<|im_start|>assistant\n" + "mulu_title_Level_2": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题", + "mulu_title_Level_2_1": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题和二级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题", + "mulu_title_Level_3": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s个二级标题;三级标题个数适中", + "mulu_title_Level_3_1": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数适中", + "mulu_title_Level_3_2": "任务:生成目录\n为论文题目“%s”生成中文目录,要求只有一级标题,二级标题和三级标题,一级标题使用中文数字 例如一、xxx;二级标题使用阿拉伯数字 例如1.1 xxx;三级标题使用阿拉伯数字 例如1.1.2 xxx;一级标题生成%s个;每个一级标题包含%s-%s个二级标题;三级标题个数越多越好" } prompt_biaogekongzhi = { @@ -84,49 +89,49 @@ id_to_lable = { nums_word_dict = { "3000": { - "prompt": prompt["mulu_title_Level_2"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2"]), "title_1_nums": "3", "title_2_nums": ["2"], "title_small_nums": ["3", "2"] }, "5000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "3", "title_2_nums": ["2","4"], "title_small_nums": ["3", "2","4"] }, "8000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "4", "title_2_nums": ["2", "4"], "title_small_nums": ["4", "2", "4"], }, "10000": { - "prompt": prompt["mulu_title_Level_2_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_2_1"]), "title_1_nums": "6", "title_2_nums": ["2", "5"], "title_small_nums": ["6", "2", "5"], }, "15000": { - "prompt": prompt["mulu_title_Level_3_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]), "title_1_nums": "5", "title_2_nums": ["2", "3"], "title_small_nums": ["5", "2", "3"], }, "20000": { - "prompt": prompt["mulu_title_Level_3_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]), "title_1_nums": "6", "title_2_nums": ["2", "4"], "title_small_nums": ["6", "2", "4"], }, "30000": { - "prompt": prompt["mulu_title_Level_3_1"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_1"]), "title_1_nums": "7", "title_2_nums": ["3", "5"], "title_small_nums": ["7", "3", "5"], }, "50000": { - "prompt": prompt["mulu_title_Level_3_2"], + "prompt": qwen_think_prompt.format(prompt["mulu_title_Level_3_2"]), "title_1_nums": "8", "title_2_nums": ["3", "8"], "title_small_nums": ["8", "3", "8"], @@ -450,7 +455,8 @@ def biaogegongshi_kongzhi_prompt(title, mulu_list, table_and_formulas_list): ",".join(prompt_2_kongzhi), prompt_biaogekongzhi["prompt3_multiple_tags"].format("&".join(lable_en), "&".join(lable_en)), ]) - prompt = "<|im_start|>user\n任务:公式和表格生成控制\n{}<|im_end|>\n<|im_start|>assistant\n".format(prompt) + prompt = "任务:公式和表格生成控制\n{}".format(prompt) + prompt = qwen_think_prompt.format(prompt) prompt_list.append(prompt) return prompt_list