《魚羊防采集》獨(dú)家首創(chuàng)網(wǎng)頁防采集程序。通過在網(wǎng)頁中加入干擾代碼來達(dá)到防止采集軟件采集信息的目的,對(duì)網(wǎng)頁顯示和搜索引擎收錄無任何影響。經(jīng)過半年多來的努力,魚羊小子盡可能的將所想到的防采集思路付諸實(shí)踐。但由于自身在制作魚羊防采集的時(shí)候毫無VC++語言基礎(chǔ)。雖說有一定的其他程序語言功底,在拼積木的方式下把魚羊防采集做到今天這個(gè)地步,自身能力上也有很大的提高。但程序很多基礎(chǔ)方面處理的并不好,數(shù)據(jù)保存查找方式、多線程數(shù)據(jù)安全、驗(yàn)證碼生成等都是請(qǐng)別人幫忙完成的。
功能特點(diǎn):
對(duì)網(wǎng)頁毫無影響
程序在網(wǎng)頁中加入“空格”;“換行符”;“Tab制表符”來打亂網(wǎng)頁html源代碼模板,使采集軟件的采集模板失效,使一個(gè)模板不能做為通用采集模板。此技術(shù)基于《魚羊防采集》v1.x測(cè)試版本的基礎(chǔ)上,對(duì)搜索引擎毫無影響。
處理后的代碼對(duì)比原代碼,處理后的代碼只比原代碼稍稍大些。網(wǎng)頁顯示無任何影響,對(duì)于非專業(yè)訪客根本察覺不出任何變化。
處理后的頁面對(duì)于搜索引擎的收錄無任何影響。因防止了軟件對(duì)網(wǎng)頁信息的采集,讓搜索引擎判斷為獨(dú)創(chuàng)文章而非垃圾信息,而提高網(wǎng)頁排名。
代碼簡(jiǎn)單易整合
調(diào)用簡(jiǎn)單,只需幾行代碼便可完成防采集調(diào)用處理。
整合方便,容易整合到任何ASP或PHP網(wǎng)站中。
防采集能力強(qiáng)大
防采集處理后的網(wǎng)頁,與原網(wǎng)頁有程序無法匹配的規(guī)則,使采集程序的采集模板無非做為通用采集模板,極大程度的防止了程序采集對(duì)網(wǎng)頁的采集。
采集程序根據(jù)采集模板對(duì)網(wǎng)頁進(jìn)行匹配采集處理,經(jīng)防采集程序一處理,使得原采集模板失效。就算采集者對(duì)處理后的頁面編寫采集模板,也無法對(duì)毫無規(guī)則的網(wǎng)頁進(jìn)行多頁匹配采集。最后使得專業(yè)采集程序?qū)W(wǎng)頁采集毫無辦法。
對(duì)于專業(yè)采集程序都無辦法,CMS程序自帶或配置的采集程序更無辦法。
對(duì)于通過防采集程序處理后的頁面,采集者只能采用原始的手動(dòng)采集方法來進(jìn)行采集。
更新日志:
1.增加時(shí)間限制功能
2.修復(fù)模塊優(yōu)先級(jí)設(shè)置無效漏洞
3.修復(fù)模塊數(shù)據(jù)關(guān)鍵詞錯(cuò)誤 “Cofing”修復(fù)為“Config”
4.取消授權(quán)功能
5.開放源碼
其他說明
魚羊防采集v2.x版本有別于魚羊防采集v1.x測(cè)試版
v2.x中使用的是對(duì)網(wǎng)頁無影響的空格 回車 和 Tab來打亂源代碼的
v1.x則是加入字符a-z;A-Z;0-9
v1.x對(duì)搜索引擎的影響還有待觀察
魚羊防采集自v3.0以來,一直存在著一點(diǎn)問題,魚羊小子也盡力尋找并解決之。但畢竟VC++語言功底不雄厚,始終沒有解決問題。
我很希望將魚羊防采集發(fā)揚(yáng)光大,但自知自己能力有限,經(jīng)過半個(gè)月的思考決定開放魚羊防采集的源代碼以供大家參考。希望有能力朋友根據(jù)此做出完善的防采集器來,源代碼無條件使用。
對(duì)我來說我已經(jīng)盡力了,我所想到的也都去實(shí)踐了。
魚羊防采集v2.0正式版
完全免費(fèi)無限制
對(duì)網(wǎng)頁毫無影響
代碼簡(jiǎn)單易整合
防采集能力強(qiáng)大
完全免費(fèi)無限制
相對(duì)于與《魚羊防采集 v2.0專業(yè)版》功能毫無差別,并完全免費(fèi)。關(guān)于源碼:程序是使用VS.NET 2008編輯