網(wǎng)站原創(chuàng)內(nèi)容在搜索引擎排名中占有重要地位,但原創(chuàng)內(nèi)容不易,偽原創(chuàng)又怕不被視為原創(chuàng),所以無(wú)用。很多站長(zhǎng)都想利用原創(chuàng)內(nèi)容來(lái)提高自己網(wǎng)站的收錄和排名,但是原創(chuàng)內(nèi)容的制作并不是一件容易的事。偶爾,一兩篇文章應(yīng)該沒問題。如果一天一兩篇,很多人會(huì)受不了。因?yàn)榇蟛糠终鹃L(zhǎng)都沒有寫手那么圓滑。比如你想寫一篇關(guān)于成都租車的原創(chuàng)文章,如果你對(duì)汽車不是很了解,肯定半天說(shuō)不出來(lái)。因此,如何把別人的文章改成偽原創(chuàng),讓搜索引擎認(rèn)為是原創(chuàng)內(nèi)容,這是很多站長(zhǎng)追求的效果。
1、對(duì)文章的內(nèi)容進(jìn)行分析比較
首先從搜索引擎的角度考慮:
用戶在做偽原創(chuàng)時(shí)經(jīng)常使用的方法有:
(1) 刪除部分內(nèi)容
(2) 增加一些內(nèi)容。在復(fù)制的文章中添加兩句話,或合并多篇文章。
(3) 改變內(nèi)容順序。將原文1.A、2.B、3.C、4.D、5.E改為1.C、2.B、3.E、4.A、5.D
使用分詞技術(shù)對(duì)相關(guān)內(nèi)容進(jìn)行比對(duì)后,分析項(xiàng)目包括:
(1)字長(zhǎng)
(2) 幾個(gè)關(guān)鍵字的出現(xiàn)頻率
(3) 文中任意幾句
(4) 鏈接
程序分析過程:
如果(字?jǐn)?shù)相同)和(幾個(gè)關(guān)鍵詞頻率相同)和(文中的幾個(gè)句子相同)和(鏈接指向一篇與本文相似度90%以上的文章)
或文中任意5句或更多句(長(zhǎng)短不一,可能是5-30個(gè)字符)是一致的
然后判斷為抄襲或者偽原創(chuàng)。
從上面的程序分析過程可以看出,單純的刪除內(nèi)容,添加合并部分內(nèi)容,改變內(nèi)容順序,段落順序,是無(wú)法讓搜索引擎認(rèn)為是原創(chuàng)的。為什么?因?yàn)橛蒙厦孢@個(gè)簡(jiǎn)單的方法,就可以看出大致的思路了。字的大小,幾個(gè)關(guān)鍵詞出現(xiàn)的頻率,鏈接都好辦,但是要比較正文中的任意幾句就不是那么容易了。
2、標(biāo)題
如果相同,則很可能被復(fù)制,但如果更改標(biāo)題,如將《成都租車常識(shí)》 更改為《教您怎樣在成都租車》,則含義不變,但文本發(fā)生變化。所以不能單憑標(biāo)題判斷是否原創(chuàng)。但是可以做如下分析:
由于搜索引擎的數(shù)據(jù)量太大,不可能把所有的內(nèi)容都比對(duì)出來(lái),還要用到“分詞”技術(shù):
(1) 如果搜索引擎蜘蛛訪問的頁(yè)面是一個(gè)新頁(yè)面,那么它會(huì)先收集這個(gè)頁(yè)面的內(nèi)容,放入數(shù)據(jù)庫(kù)(或其他),等待其他程序比較內(nèi)容是否是原創(chuàng)的或不。不是一個(gè)有價(jià)值的處理程序。此時(shí),將不會(huì)搜索此內(nèi)容。
(2)分析內(nèi)容。它還利用分詞技術(shù)對(duì)標(biāo)題、內(nèi)容等進(jìn)行了分析,得出了本頁(yè)的主要內(nèi)容。對(duì)于像《周杰倫2010年專輯》這樣的文章,它會(huì)與包含“周杰倫”、“2010”、“專輯”等關(guān)鍵字的文章進(jìn)行比較,而不是與所有網(wǎng)頁(yè)進(jìn)行比較。如果結(jié)果是原創(chuàng)的并且更有價(jià)值,它將被包含并賦予更高的權(quán)重。如果認(rèn)為是抄襲或抄襲,則不會(huì)收錄,或者權(quán)重很低。對(duì)了,這個(gè)頁(yè)面的權(quán)重不僅關(guān)系到它本身的內(nèi)容,自己的內(nèi)容,能不能有好的排名,還關(guān)系到整個(gè)站點(diǎn)的權(quán)重。比如這個(gè)頁(yè)面的權(quán)重是3,網(wǎng)站的權(quán)重是3,那么一共是6。如果其他網(wǎng)站轉(zhuǎn)載這篇文章,文章的權(quán)重是1,但是他網(wǎng)站的權(quán)重是7,那么總分是8.68,所以轉(zhuǎn)載的文章仍然會(huì)排在原文章的前面。
信息來(lái)源推來(lái)客:集群網(wǎng)站建設(shè)
我們專注高端建站,小程序開發(fā)、軟件系統(tǒng)定制開發(fā)、BUG修復(fù)、物聯(lián)網(wǎng)開發(fā)、各類API接口對(duì)接開發(fā)等。十余年開發(fā)經(jīng)驗(yàn),每一個(gè)項(xiàng)目承諾做到滿意為止,多一次對(duì)比,一定讓您多一份收獲!