• <dd id="98y3c"><pre id="98y3c"></pre></dd>
    <em id="98y3c"></em>

    <em id="98y3c"></em>

    發新帖

    劉建國:Google反作弊不如百度

    2177 5
    原文如下:


    反作弊是我們的技巧


    《21世紀》:李彥宏選擇引擎作為百度的主業,當時是怎么肯定的?


    劉建國:2000年之前,中國有很多引擎公司,Goyoyo是噴鼻港一個公司做的;科學院有一個網站,還有北大年夜天網。當時創建公司時引擎已經很多了。我們機會在哪里?在當時我和李彥宏的通信中,他說要做就做最好的。當時已有的引擎速度慢,索引小,用戶體驗很差。我們都認為做一個中文引擎有很早年成,所以我就大年夜北大年夜出來,跟李彥宏一路創業了。


    《21世紀》:如今來看,當時的核心技巧是什么?


    《21世紀》:是應用軟件?


    劉建國:分成好幾塊,一塊是網頁抓取,由蜘蛛法度榜樣選擇、抓取互聯網中的網頁,還要持續賡續地更新網頁,將過時的網頁剔除掉落;二是超鏈分析和內容分析;三是針對用戶的辦事:若何處理海量數據和大年夜范圍的用戶拜訪?若何供給穩定的辦事?有很多技巧問題須要解決。


    《21世紀》:你們是一幫人在做?


    《21世紀》:百度在相干性方面有什么特點?


    《21世紀》:&ldquo;欺騙&rdquo;是什么意思?你們有什么獨特的技巧來對于它?


    劉建國:就是所謂的收集優化,比如引擎優化之類,鏈接一些域名,好象鏈接很多,但實際上是工資做出來的。還有一些鏈接,就是專門幫別人做鏈接,這也是超鏈分析。你不是鏈接分析嗎?專門針對你。還有一些網站,專門給別人做,相干度也高,我們必須發明哪些是LINKFORM,然后分析出來。


    《21世紀》:這若何看得出來?有簡單對象嗎?


    劉建國:我們已經可以經由過程技巧手段及時發明這種欺騙或者叫作弊。是否作弊,有一個很簡單的標準:用戶看到的內容和引擎看到的內容是否一致?前一段&ldquo;芙蓉姐姐&rdquo;,進去之后很多是買手機的,買其他信息,這就是作弊。我們就分析,他們是經由過程什么辦法來&ldquo;欺騙&rdquo;。比如LINKFARM,我們靠技巧發明出來,它已經&ldquo;堆砌關鍵詞&rdquo;了,我們看出它是作弊的,我就不要它。這就是為何后來反彈這么大年夜,有了&ldquo;反百度聯盟&rdquo;的原因。有&ldquo;反百度聯盟&rdquo;成員說,你為什么樊籬我?前一段搜狐網的一個峰會,一個醫藥網的說我們很好啊,你為什么把我給封了?它的&ldquo;堆砌&rdquo;是作弊的,如不雅我們把它攤開,對用戶是一種欺騙。


    《21世紀》:比如在百度搜&ldquo;芙蓉姐姐&rdquo;,你們把有些&ldquo;芙蓉姐姐&rdquo;鏈接給樊籬了,那就不克不及給用戶供給更多的結不雅了?


    劉建國:有兩個根本方面:超鏈分析和內容分析。我們這幫技戀人員,包含李彥宏,根據引擎當時的技巧成長,做出了一套百度本身的超鏈分析體系。別的還得分析網頁內容,比如中文處理就很重要,要懂得中文的語法和特定文字意義,因為中文與英文┞氛樣不一樣的,只有斷定文字是什么意思,才能給用戶供給結不雅。


    劉建國:是更精確,比如用戶到這里來搜,獲得的是真正的&ldquo;芙蓉姐姐&rdquo;而不是手機鈴聲。如許做的目標是給用戶很好的用戶體驗。


    《21世紀》:在反作弊技巧里,有什么可以明白辨認作弊?


    劉建國:比如,往返互相鏈接、堆砌關鍵詞等。還有前風景和配風景完全一致,在HTML瑯綾擎,用戶看不見,可以騙引擎,就如許騙用戶。


    《21世紀》:僅僅配風景也可以用來作弊?


    劉建國:背景是黑色的,看見的僅僅是內容,是看不到背景的。前景與后景一樣,機械看不著,人能看出來,風景也是識其余身分。個中的文字就是有些網站想欺騙的器械。有很多辦法作弊,層出不窮的。與作弊網站是永遠不會停止的┞方爭。


    《21世紀》:有沒有可以&ldquo;招安&rdquo;的作弊網站?


    劉建國:不會的。他們的好處很大年夜,騙一點是一點,不會到這里來做。


    《21世紀》:有若干如許的網站?


    劉建國:天天碰著成千如許的網站。


    《21世紀》:他們到哪里拉客戶?


    劉建國:不必定拉客戶,他們可以本身做鈴聲、短信,引擎優化會拉企業,給錢,我給你排位。


    另一個&ldquo;仇敵&rdquo;是Google嗎?


    《21世紀》:與Google的反作弊比,你們有什么竽暌古勢?


    劉建國:說Google的技巧比我們好,我不認同,他們主如果不敷集中。比如反作弊的,Google中文就做不過我們,這有技巧問題,還有人力,要知道作弊慣用的手段,而Google不知道。這個模式我們比Google成長得更快,我們更接近用戶。我們中文的懂得做得比他們好,比如像分詞、切詞,中文是一個一鋼髦棘放一可兒,那些字和詞是不一樣的。我做得比Google好。他們沒有專門研究中文。


    《21世紀》:你們是用本身的技巧?


    劉建國:是的。我們中文分詞,這個技巧瑯綾擎沒有英文,中文本身的處理我們已經到位,還有語法的應用,我們做得很好。語法是主謂賓,若何用,老外不睬解。


    《21世紀》:你們用以前的文字辨認技巧嗎?


    劉建國:對中文我們有一套獨特的做法,如今成熟的技巧都不太合適我們。


    劉建國:不是一套。我們直接用本身的器械。比如說詞典、分詞、詞匯。這不是釋義的詞典,可能有很多資本。比如我們用人平易近日報的語料庫,我們購買如許的材料。更多的平臺是我們本身的引擎。我們有日記,總結新的詞匯。我們對10億計的網頁也能分析。這是Google中文做不到的。至少沒有聚焦。別的大年夜中文用戶體驗來說,我們也做得比他們好,比如用戶體驗是什么、習慣是什么。比如相干,在中文瑯綾擎,用戶心里想的一個工作,比如&ldquo;軟件&rdquo;這個詞,用戶心里想的是軟件下載,但的是&ldquo;軟件&rdquo;這個詞,他輸入&ldquo;軟件&rdquo;,與不符。百度會提示得加倍精細化,到底是軟件下載照樣加密,全主動辦事,如許用戶會認為很好。類似的工作我們下了很多工夫。其他像拼音檢索,錯別字改┞俘,我們也能精確提示。如今有些正在抄我們。我認為不克不及崇洋。


    《21世紀》:有沒有效哪個平臺?比如大年夜的軟件?


    劉建國:這個軟件是我們本身做的。


    對百度,CTO劉建國的查訪過程就是一個擠牙膏的過程,他永遠不會借題發揮,對查訪者的問題,答復得簡潔而專注。這位郵攀李彥宏一路創建百度的&ldquo;技巧新官僚&rdquo;,對引擎技巧應用的思慮,在必定程度上表現了這個新上市公司的貿易偏向及這個團隊的技巧想象力。查訪中,劉建國賡續接到請求解封的&ldquo;作弊網站&rdquo;的德律風,大年夜多是熟人才會直接將德律風打到他這里,或是打給李彥宏。查訪由此而展開。


    劉建國:很多多少個組,重點是相干性的評價。哪些網頁是用戶想要的?后面就有很多多少技巧;比如超鏈分析;這里有李彥宏的專利。超鏈在Infoseek之前就有成熟的技巧,李彥宏在那兒工妝廄研究得很細,但我們沒有僅用這套辦法,而是根據當時引擎全球的成長做了改進。

    精彩評論5

    排名第二
    SEO外包   學習于  2016-7-5 17:57:11
    樓主是優化界超人
    排名第三
    c8sv   學習于  2016-7-5 18:06:39
    頂頂多好,多學點優化技巧
    排名第四
    ez2r3   學習于  2016-7-5 18:14:19
    真心頂樓主可否給我的網站做優化
    排名第五
    5800   學習于  2016-7-5 18:27:36
    難得一見的好帖教會我如何優化網站
    排名第六
    c8sv   學習于  2016-7-5 18:26:29
    技術和方案都很好哦
    99久久免费热在线精品,久久爱,偷拍久久国产视频,久久成人视频,