普通版降重
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

55 lines
1.7 KiB

方案1
1.人名替换处理
2.使用翻译模型翻译出来句子人工筛选
3.筛选出来的句子进行训练
训练方案1
常规训练方案
训练方案2
使用simbert方式训练
翻译模型方案
1,使用百度注册账号
2,https://www.oschina.net/news/170812/meta-open-source-wmt-21
3,使用t5模型训练
改写语料
1,现有的语料 58万
2,lcqmc语料
写作猫发现的规律
1.
可以确定的是,应该是用模型做的,因为同样的短句,后面加点东西和不加,出来的整体句子都不一样
伴随着风硕哀嚎的声音,白策笑嘻嘻的离开了。 --> 在冯硕的惨叫声中,白策嘿嘿一笑,转身离去。
伴随着风硕哀嚎的声音 --> 伴随着风硕的惨叫声
2.
人名特殊处理
3.(待定,因为试了几条结果跟我预想的差不多,不敢确定)
一般是合并句子居多,且一般是前面句子或者后面句子形容中心句
修改后短句增多的例子
对方无声哭泣着再次说了一遍。 --> 对方带着哭腔,又重复了一遍。
足足等到叶澜歌换好了衣服 --> 一直到叶澜歌穿好衣服,这才停了下来。
修改后短句合并的例子
林天宇瞬间就察觉到问题,对着她,轻声问道,“你是不是察觉到什么?” --> 林天宇立刻意识到了不对劲,小声的问了一句,“有没有发现?”
方案:
1,有可能形容词替换之后(使用work2vec),再用中译英英译中(也会补充出来代词)
张三尖叫的喊道
张三尖叫的嚷嚷道 --> 张三大吼一声。 --> 张三咆哮起来。 --> 张三大吼一声。