網站用戶的識別

網站用戶的識別

用戶分析是網站分析中一個重要的組成部分,在分析用戶之前我們必須首先能夠識別每個用戶,分辨哪些是”New Customer”,哪些是”Repeat Customer”。這樣不但能夠更加清晰地了解到底有多少用戶訪問了你的網站,分辨他們是誰(用戶ID、郵箱、性別年齡等);同時也能夠幫助你更好地跟蹤你的用戶,發現它們的行為特征、興趣愛好及個性化的設置等,以便于更好地把握用戶需求,提升用戶體驗。

通常當你的網站提供了注冊服務,而用戶注冊并登陸過你的網站,那么用戶可以更容易地被識別,因為網站一般都會保存注冊用戶的詳細信息;但是你的網站并不需要注冊,而用戶的行為以瀏覽為主,這是用戶識別就會顯得較為困難,下面提供了幾種常用的用戶識別的方法:

識別用戶的幾種方法

當用戶并未注冊登錄的情況下,識別用戶的唯一途徑就只剩下用戶瀏覽行為的點擊流數據,通常情況下它們會保存在WEB日志里面,關于WEB日志的詳細說明可以參考我之前的文章——WEB日志格式。而WEB日志本身存在的缺陷可能導致用戶識別的不準確性,關于WEB日志的缺陷可以參考之前的文章——WEB日志的作用和缺陷,所以我們在選擇用戶識別方法的過程中,在條件允許的情況下盡量選擇更為準確的方法:

1、基于IP的用戶識別

IP地址是最容易獲取的信息,任何的WEB日志中均會包含,但其局限性也較為明顯:偽IP、代理、動態IP、局域網共享同一公網IP出口……這些情況都會影響基于IP來識別用戶的準確性,所以IP識別用戶的準確性比較低,目前一般不會直接采用IP來識別用戶。

獲取難度:★

準確度:★

 

2、基于IP+Agent的用戶識別

同樣基于最簡單形式的WEB日志,我們可以增加一項——Agent,來提高單一IP方式識別用戶的準確性。Agent也是WEB日志中一般都會包含的信息,通過IP+Agent的方式可以適當提高IP代理、公用IP這類情況下用戶的分辨度,同時通過Agent還可以識別網絡爬蟲等特殊“用戶”,但同樣準確度也欠高。

獲取難度:★

準確度:★★

 

3、基于cookie的用戶識別

當你通過自定義Apache日志格式或者JavaScript的方法獲得用戶cookie的時候,其實你已經找到了一個更有效的用戶識別的手段。cookie在未被清除的其前提下可以認為是跟某個訪問客戶端電腦綁定的(一個客戶端有可能包含多個cookie),所以用cookie來標識用戶其實指的是用戶使用的客戶端電腦,而并非用戶本身。

用cookie識別用戶的方法當然也存在缺陷:最常見的就是cookie被清除而導致用戶無法與原先記錄實現對應;同時由于客戶端電腦會被共用,或者用戶會在不同的電腦上訪問你的網站,這個時候cookie就無法直接對應到該用戶了。

獲取難度:★☆

準確度:★★☆

 

4、基于用戶ID的用戶識別

基于用戶ID的用戶識別是最為準確,因為一般情況下用戶不同共享他的用戶ID,所以我們可以認為數據中的userid唯一地指向該用戶,幾乎不存在偏差。當然要使用用戶ID來識別用戶是需要一定的前提條件的:網站必須是提供用戶注冊登錄服務的,并且可以通過一些手段在點擊流數據中記錄userid。

獲取難度:★★

準確度:★★★

所以對于一個需要用戶ID注冊登錄的網站來說,用戶唯一標識符的選擇可以遵從以下順序:當用戶注冊登錄時以userid為準,當用戶在未登錄狀態瀏覽時以用戶的cookie為準,當用戶未登錄且cookie無法獲取的情況下以IP+Agent為準;這樣就能從最大程度上識別唯一用戶。

 

這里推薦一個網站日志中cookie項的自定義設置方法,以便更好地識別用戶。cookie是從用戶端存放的cookie文件記錄中獲取的,這個文件里面一般在包含一個cookieid的同時也會記下用戶在該網站的userid(如果你的網站需要注冊登陸并且該用戶曾經登錄過你的網站且cookie未被刪除),所以在記錄日志文件中cookie項的時候可以優先去查詢cookie中是否含有用戶ID類的信息,如果存在則將用戶ID寫到日志的cookie項,如果不存在則查找是否有cookieid,如果有則記錄,沒有則記為”-”,這樣日志中的cookie就可以直接作為最有效的用戶唯一標識符被用作統計。當然這里需要注意該方法只有網站本身才能夠實現,因為用戶ID作為用戶隱私信息只有該網站才知道其在cookie的設置及存放位置,第三方統計工具一般很難獲取。

 

獲取用戶信息的途徑

通過以上的方法實現用戶身份的唯一標識后,我們可以通過一些途徑來采集用戶的基礎信息、特征信息及行為信息,然后為每位用戶建立起詳細的Profile:

1) 用戶注冊時填寫的用戶注冊信息及基本資料;

2) 從網站日志中得到的用戶瀏覽行為數據;

3) 從數據庫中獲取的用戶網站業務應用數據;

4) 基于用戶歷史數據的推導和預測;

5) 通過直接聯系用戶或者用戶調研的途徑獲得的用戶數據;

6) 有第三方服務機構提供的用戶數據。

識別并獲取用戶信息的價值

通過用戶身份識別及用戶基本信息的采集,我們可以通過網站分析的各種方法在網站是實現一些有價值的應用:

1>基于用戶特征信息的用戶細分;

2>基于用戶的個性化頁面設置;

3>基于用戶行為數據的關聯推薦;

4>基于用戶興趣的定向營銷;

……

來源:網站數據分析

技術控是百度新聞與鈦媒體合作,專門為技術愛好者打造的欄目

未經允許不得轉載:西安王塵宇 » 網站用戶的識別

贊 (0)
一级A试看120秒