說明:如果您有任何疑問或想咨詢其他業(yè)務(wù)請撥打電話 400 685 0732
全網(wǎng)監(jiān)測海量數(shù)據(jù)按需發(fā)布監(jiān)測預(yù)警
實(shí)時(shí)把握輿情動(dòng)態(tài)精準(zhǔn)追溯信息源頭
搜索引擎是怎樣判斷原創(chuàng)文章的呢?
作為文章內(nèi)頁,文章的內(nèi)容占頁面的大部分面積,首先我們來看搜索引擎是如何判斷的。
網(wǎng)頁的大致構(gòu)成:
<html>
<head>
<title>網(wǎng)頁標(biāo)題</title>
網(wǎng)頁基本信息描述(CSS、JS、RSS、keywords等基本描述)
</head>
<body>
網(wǎng)頁的主題內(nèi)容
</body>
</html>
上面是一個(gè)網(wǎng)頁的基本元素,<head></head>是網(wǎng)頁的基礎(chǔ)描述,無論是搜索引擎還是用戶(搜索結(jié)果),這是了解該網(wǎng)頁基礎(chǔ)的信息。
一個(gè)網(wǎng)頁的重點(diǎn)應(yīng)該是<body></body>之間的內(nèi)容,這里是記錄該網(wǎng)頁詳細(xì)的信息,用戶通過瀏覽器也只能看見<body>元素里面的內(nèi)容,所以,搜索引擎重點(diǎn)處理的內(nèi)容包含在<body>元素里面。
了解了網(wǎng)頁的大致構(gòu)成后,我們來看看搜索引擎是如何對網(wǎng)頁建立索引的。
搜索引擎建立索引和返回結(jié)果
首先我們要明白一點(diǎn),搜索引擎不是智能,當(dāng)然也不具備分析文章內(nèi)容的能力,這也是為什么一些我們認(rèn)為是牛頭不對馬嘴的文章,搜索引擎確收錄的很好。
再來看文章,一篇文章是由很多句子構(gòu)成的,句子又是由很多詞語來組合而成的。
搜索引擎在對網(wǎng)頁建立索引的時(shí)候,應(yīng)該選擇基礎(chǔ)的方式,那是將文章拆分為若干詞語,再將這次詞語進(jìn)行轉(zhuǎn)換“二進(jìn)制(不敢確定具體單位)”,在搜索引擎的算法里面,這些“二進(jìn)制”將用于各種計(jì)算。根據(jù)用戶的關(guān)注度,這些“二進(jìn)制”和對應(yīng)的算法結(jié)果將被預(yù)先儲存,以便及時(shí)向用戶展示算法結(jié)果(搜索結(jié)果),一些關(guān)注度不高的,及時(shí)返回?cái)?shù)據(jù)。由于涉及的數(shù)據(jù)不多,處理速度完全可以滿足。
通過上面的分析和目前搜索引擎的變化,熱門關(guān)鍵詞排名相對穩(wěn)定(一段時(shí)間更新一次),長尾關(guān)鍵詞的排名不穩(wěn)定的大致情況了。
說明:如果您有任何疑問或想咨詢其他業(yè)務(wù)請撥打電話 400 685 0732