云南網(wǎng)站建設創(chuàng)新企業(yè) 昆明多彩網(wǎng)絡公司

在線qq:540105663

搜索引擎到底會不會抓取圖片、js、fhash內容?

來源:昆明多彩網(wǎng)絡公司 日期:2010-08-18 閱讀: 發(fā)表評論

這其實是一個很古老的話題了,現(xiàn)在網(wǎng)絡上很多文章主張的觀點其實都是幾年的了事情,互聯(lián)網(wǎng)發(fā)展速度可以用飛速來形容,去年說的也許今年就要完全被顛倒,對于搜索引擎抓取什么內容問題我們認為要區(qū)別對待

網(wǎng)頁組成內容無非就是文字,圖片,js,動畫flash,視頻元素,早在幾年前,在搜索引擎發(fā)展初級階段的時候,搜索引擎的抓取內容方式是及其原始和簡陋的,而且只能抓取網(wǎng)頁的title等頁頭部分。

當時站長群也很少,而且做一個關鍵詞也非常容易,主要隨便修改一下網(wǎng)頁的標題就可以達到很好的排名,隨著搜索引擎數(shù)據(jù)發(fā)掘技術的發(fā)展,搜索引擎慢慢會嘗試去抓取更多的東西,比如網(wǎng)頁的其他文字內容,并且不再將網(wǎng)頁標題作為唯一的排名標準,并且加入了很多其他的算法來給一個網(wǎng)站在搜索引擎上綜合的排名。

目前來說,百度能夠很好的識別和把握中文內容,不然也不會對外號稱自己是全球第一大中文搜索引擎,對圖片能夠有一定程度的識別,而對flash動畫和視頻抓取技術還比不上google;谷歌雖然不主張站長使用動畫來作為網(wǎng)站主要展示內容的方式,但是經過大家試驗,一些簡單的flash動畫內的問題google能夠很好的識別,并將該元素內抓取的內容作為網(wǎng)站綜合排名的依據(jù),而百度似乎還是停留在文字和圖片基礎上。

谷歌對于一些單色背景圖片能夠很好的識別,比如黑色背景上打上白色的字,谷歌的識別幾乎達到了100%。

發(fā)表評論評論列表(有 條評論)