周大老板這個技術外行,怎么還關心起技術細節來了?
就緩緩的解釋道:“爬蟲是搜索的基礎工具,爬蟲搜信息……嗯,就跟使用瀏覽器上網差不多,都是先向服務器發送請求,獲得返回的頁面,然后篩選出有價值的內容。如果時間足夠長計算量足夠大,使用爬蟲工具,就可以把互聯網上的所有信息都搜索一遍。”
見周大老板似乎很感興趣的樣子。
王小船就拿過紙筆,很快速的寫下了一行代碼,“假如說我們要爬取微知網的信息,用這行代碼就可以實現了。”
周不器拿過代碼一看,嗯,是很簡單。
&={‘’:‘’,}
&“
&=>
&>
難怪說3月份的時候,北科有兩個計算機系的大學生被開除了。
這技術好像是不太難。
因為大四寫論文,可用谷歌、百度、微點等搜索引擎,卻搜不到別人寫的相關論文。怎么辦?就有計算機系的學生,自己寫了段爬蟲算法。
然后成功的爬取到了幾百篇相關論文。
內容未完,下一頁繼續閱讀