首頁>社情·民意>你言我語 你言我語

網絡作品“偽原創(chuàng)”花樣多:工具可自動生成文章

2017年05月09日 11:10 | 作者:張昊 | 來源:法制日報
分享到: 

在線自動生成“偽原創(chuàng)”

記者在調查中發(fā)現,除了劉思含提到的各種“偽原創(chuàng)”手法,還有一種模式——在線自動生成“偽原創(chuàng)”。

記者通過閱讀多個“偽原創(chuàng)”工具的說明并試用,梳理出其制作過程和原理?!皞卧瓌?chuàng)”的目標是通過同義詞替換的方式,讓搜索引擎認為是一篇原創(chuàng)文章,從而提高在搜索結果中的排名。“偽原創(chuàng)”工具或在線生成網站都有自己的同義詞庫,有的通過免費模式向用戶開放一部分,另一部分更大的同義詞庫則要用戶付費后才可以使用。

“用‘偽原創(chuàng)’工具可以把在互聯網上復制的文章瞬間變成您自己的原創(chuàng)文章。”一個“偽原創(chuàng)”網站的說明這樣寫到。此類“偽原創(chuàng)”工具還可以在文章中隨意植入想被讀者看到的關鍵詞或網址,以達到宣傳作用。

記者把原創(chuàng)文章復制粘貼到這樣的網站上,一鍵即可生成同義詞替換過的文章,被替換的詞通常用不同的字體和顏色標記出來。

在這個過程中,記者發(fā)現,專業(yè)類文章替換較少;生活類的文章替換掉的詞較多;文章越長,替換率越高。在線“偽原創(chuàng)”工具還附帶相似度檢測、關鍵詞排序、關鍵詞統(tǒng)計、關鍵詞組合工具等在線工具,文章整體替換的比例在10%左右。替換后的文章可讀性降低,網站建議對文章進行人工修改提升可讀性。一個“偽原創(chuàng)”網站在說明中稱,“‘偽原創(chuàng)’文章最好將文章開頭和結尾用自己的語言組織,這樣的效果更好一些”。

記者使用相似度檢測對原創(chuàng)和“偽原創(chuàng)”進行對比發(fā)現,機器識別出相似度在85%至98%之間。

記者在網站上看到一個生成記錄,內容文本字符長度為734個字的文章,共替換了44個詞長度為90個字符,替換比率為12.26%。原文和替換之后的文章相似度為92.6%,如此高的相似度怎么辦?這些網站給出了進一步的“解決方案”。

“在線生成文章,將其粘貼入前兩步已做好的‘偽原創(chuàng)’文章后一段即可”。記者點擊“在線生成文章”發(fā)現,生成的并不是可讀的文章,而是一段看似是中文的亂碼。將這段亂碼貼在文章最后,相似度降低到84.3%。

除了用亂碼降低相似度,這些網站介紹稱還可以在文章中插入圖片,建議用戶打亂文章順序等方法。

此外,記者發(fā)現,網上還可以搜索到大量關于“如何制作‘偽原創(chuàng)’”的教程。

編輯:梁霄

01 02 03

關鍵詞:網絡 作品 文章 工具

更多

更多