2015年4月15日 星期三

到底誰想把台妹?〔談Google搜尋趨勢分析〕

原始發布日期:25 三月, 2010 16:59

TVBS的報導引發了到底台妹好不好把,以及老外愛不愛把台妹的爭論。

不過,根據我的研究,若依照TVBS的邏輯,老外對台妹的心思其實是最單純的,他們對日本美妹、新加坡美妹有更多的想入非非,而且全世界最想把台妹的可能是新加坡人!




這兩天網路上有一個很熱門的話題,就是台灣女孩到底易不易擠(easy)的問題。這個問題的起因來自於TVBS的一篇報導:

>>〈獨家〉「台妹很好把」Google搜尋第一 網友轟

〔還標個「獨家」的大字!強調一下只有他們報得出這種新聞!〕

除了網友的討論之外,今天另有兩大報也對此則報導做了簡單到可以說是無關痛癢且無任何意義的後續小報導:

>>「台灣女孩很好把」Google搜尋歧視台女?

>>台灣女孩很好把? 不是google的錯

先說Google的自動提示功能

這次TVBS所報導的問題核心是Google的自動提示,或是「聯想詞搜尋」(對岸說法)功能。

有使用過Google的人都知道,在Google搜尋框裡輸入關鍵字過程當中,在你輸入第一個字之後,它就會開始自動出現一個下拉式的選單,選單裡有與這一個字相關的更長字串,供你選擇。

如果,那些字串有你想要的,那麼就選擇該字串即可,不需再輸入那麼多文字;如果沒有,那麼你就不用理會自動顯示的字串,繼續輸入第二字、第三字……。

這項功能可以說是Google最早讓它成為搜尋引擎標準功能的,而現在,不管是雅虎,還是微軟的Bing,也都有了這個功能。只是在Bing目前只有英文才會有自動提示,中文不會有。

而這些自動出現的字串是怎麼來的呢?

基本上,搜尋引擎業者是以相關字串的搜尋熱門度(或是數量)為依據,用機器算出近期內最多人可能搜尋的關鍵字,然後將這些關鍵字提供給使用者。至於細節的演算技術,我就不懂了,而各家公司功能的好壞,其實也取決於演算技術的高低。

這種技術,對於輸入文字較慢的人來說真的是項福音──簡單說,讓這些人搜尋更容易了。

但對於我這種輸入文字很快的人來說,其實經常感覺到相當不便,因為那些自動出現的關鍵字時常會干擾到我。

但既使如此,我還是很愛這功能,因為有時在輸入關鍵字時,偶爾想不起正確的字,或一時腦袋空白,這時自動出現的關鍵字提示,讓我不用再想破頭了。

好了,現在,TVBS在Google搜尋框裡輸入了「Taiwanese Girls」(或是Taiwan girls),然後框框裡Google自動出現了包括「Taiwanese Girls are easy」在內的相關字串供他選擇,這代表什麼?

正確答案是:這代表很多輸入Taiwanese Girls的人,最後所輸入的完整搜尋字串是「Taiwanese Girls are easy」。就這樣而已,沒別的了。你頂多只能說它如實反應有很多網友在搜什麼而已,這既不代表Google的想法,也不代表有多少人瀏覽了相關功能,更不代表真的台妹就很好把。

至於在搜「Taiwanese Girls are easy」的人在幹什麼,搜這個想做什麼,對女性有沒歧視,想泡台灣女孩還是想找台妹援交等等的,這又關Google什麼事?TVBS自己做的節目都可以掛著「這不代表本台立場」的招牌了,Google又要為一個很多人在搜的關鍵字負什麼責任?

甚至,我還認為,就這個例子來看,這也沒能反應多少的社會現象,更無法代表老外對於台灣女生的刻板印象。

如何研究搜尋趨勢

如果TVBS想要用Google關鍵字來研究或闡釋社會現象,以這個例子來說,我會建議他到英文版的Google去搜搜看,就會發現到與他報導完全不一樣的結果;二是,我會建議他去「Google搜尋透視」(相當於英文版的Google Trends),可以讓他對於搜尋趨勢和社會現象之間的關係,有一個更為完整與宏觀的了解。

首先,TVBS可能有所不知,Google這家公司技術有多高。

據我了解,Google對於搜尋結果,還有搜尋框裡自動提示的關鍵字,應該都是非常「客製化的」。不只會因為你所在的國家地域、語言而有所不同,甚至,細心的使用者應該會注意到,也會因你所使用的瀏覽器不同而有所不同的。

以TVBS所用的Taiwanese Girls為例,若他要報導的是老外對台妹的觀點,還要強調輸入日本、輸入其他國家都沒這麼「糟」,那麼他應該到Google的英文網站去找找看,或許比較能代表老外觀點。結果會是與他的報導大不相同的。

TVBS報導所用的Google搜尋若是台灣版,代表的只是在台灣這裡上Google,然後使用英文搜尋的人。我從文字報導相關資料來猜測,TVBS所用的應是中文介面,所以這些人應該也會使用中文。這個族群能否代表老外?頂多是在台灣的老外吧。在台灣的老外,想把台灣妹,沒想把日本妹、韓國妹,這有什麼好奇怪的?

其次,這些自動提示字串,也是隨時在改變的。以我今天試驗的結果來說,我在上午及下午所發現的這些提示字串,就經常是不一樣的。TVBS若是想用此事來戳Google,比較建議他們要有幾天的時間,多做幾次測試再說吧;因為,很有可能只是剛好你在搜的那個時段有那種關鍵字提示。

我的測試結果

好吧,我好人做到底,就幫TVBS做個英文版的測試。

在台灣的使用者,進入Google首頁之後,可以點選右下方的英文版連結,有時候會是Google的搜尋實驗室,有時後則會是英文版的,都沒關係,總之都是英文版的,而我試了試,感覺不出結果與功能的差異。

接著,我用各個不同國家+Girls的字串,開始展開「全球女孩搜尋大測試」,看看Google會給我什麼自動提示?

大致的結果是,從世界各國的「女孩搜尋」所出現的關鍵字來看,有一些共同現象。

一是,…. Girls are easy、… girls blog、…girls hairstyle、…girls dating………其實都是各國很普遍會見到的,並不是只有專搜台灣女孩才會用「很好把」來問而已,而且「很好把」還算是最客氣的。

二是,相近國之間的女孩比較,也很常見。例如,台灣v.s.韓國、日本,和中國,美國v.s.加拿大……

另外,也可找到一些特殊的現象。

例如,搜尋台灣女孩時我曾見到「檳榔西施」(Beatle nut girls)的提示,這是其他國家所沒有的;日本的動漫女郎,還有另一個與一種超級色情行為相關的,也是獨一無二的;新加坡則會自動出現geylang(紅燈區);韓國則是以人工美女(整型)而知名;像加拿大,好像搜女子曲棍球隊的很多;印度的話,還有印度女人愛白人的……

但像泰國、峇里島,出現的一長串全都是與買春有關的,像是女孩的價格啦,酒吧女孩了,一夜情啦,夜總會玩伴、伴遊女郎啦……所以與鄰近國家比起來,台灣還是一個很清純而乾淨的地方,老外對台灣女孩的想入非非算是最少的。

有趣的是,如果你輸入的國家詞性一改,結果也可能大不一樣。例如,你若用Taiwan girls會找到一些像是「夜貓子」、「酒吧」等等的,但Taiwanese girls比較不會;若是新加坡女孩你用了Singapore girls而不用Singaporean girls,那麼出現一些買春相關字串的機會也相當大,甚至幾次結果都不輸泰國。

但我還要再強調一次:我以上所提到的所有自動提示字串,都是隨時在變動的。我從早上到下午試了無數次,每次出現的自動提示,經常都不盡相同。

以下幾個的隨機取樣,就請看倌比一比,如果這能夠代表老外對某國女孩的心思的話(我說如果),那麼他們對台妹是最單純的:↓









Google搜尋透視工具

另一個研究搜尋趨勢的方法,則是到Google Trends,中文版則叫做「Google搜尋透視」。

去年我在寫鬍子哥約砲事件時,就利用這個工具來說明搜尋趨勢並不像外面說的那麼誇張:鬍子哥的搜尋多過氣象局及颱風假。

事實上,Google在正式的記者會裡,也經常利用這個工具來為媒體解說許多有趣的社會現象與趨勢,例如,求職的相關搜尋何時較高,還有中國大陸有那些省份對於台灣旅遊相關資訊特別有興趣……全都可在這個工具裡找到。

順便再奉送大家一些Google Trends的分析數字吧。

據TVBS的解讀,Google說台妹很好把,而且TVBS似乎認為全都是老外(我們想的老外可能比較是歐美人士,特別是美國人)在把台妹,而網路上的討論也如此認為。

如果,在Google裡輸入Taiwanese girls就代表想把台妹(我說「如果」,因為我實在不相信這樣的解讀與聯想),那麼,到底那一國人對我們的台灣美妹最意圖不軌?

答案是:新加坡人,不信請看Google趨勢透析圖: ↓



而照這種邏輯,到底都是誰到泰國買春?

答案是斯里蘭卡人,不信請看: ↓



至於「Taiwanese girls are easy」呢?不好意思,因為搜尋數量不夠多,所以Google趨勢的回答是:無法分析。

不過,數字能不能用這種莫明其妙的直覺胡亂解讀?我想答案是很清楚的!

潛藏的色情問題

認真說起來,Google這項關鍵字自動提示功能真的是利多於弊,目前所見,最大的壞處,我去年寫了一系列關於搜尋引擎與色情傳播問題,也幾次提過這個問題。其中,比較完整的是這一篇:

>>Google中國太色挨轟,原來超人披風惹禍!

另外,這一篇也有提到一些些:

>>網路A片大特搜:A圖才夠強,A片算什麼!



還有,順便再介紹一下我去年為了證明搜尋引擎所存在的色情問題,這是我所開出的第一槍:


>>網路A片大特搜:那個搜尋引擎最色?



上面文章中,Google中國太色挨轟,原來超人披風惹禍!講的就是Google這個自動提示功能所帶來的色情傳播隱憂。

那件事大概是這樣的:Google去年被中國的央視節目指控說傳播淫穢內容。原因呢?他的自動提示功能會自動出現一些與淫穢內容相關的關鍵字。

原本使用者可能只是要搜尋一些再平常不過,而且很「清純」的關鍵字,結果,Google自動出現了一些糟糕的關鍵字選擇。

這是一個很實質存在的問題,而且我認為Google必需要有更多的方法來防止這樣的事發生。

例如,在台灣,你如果在Google輸入「茶」、「好茶」等字,Google會自動提示你許多看似清純的字串,但是串串都是指向色情交易。而我們不知道類似的關鍵字有多少?何時何地會出現在無辜的青少年,或者兒童面前,讓他們曝露於不當的色情內容底下?

另一個與此問題有點相關的,是「相關搜尋」功能。也就是每次搜尋結果出現時,最下面會提供幾個與你的關鍵字有關的字辭。這為何會有色情傳播問題?

例如,你輸入燕子的英文字,他可能會提供你英文的「深喉嚨」,然後點進去後盡是些不堪入目的畫面。

只是,這個問題目前到底有多嚴重?有沒有到值得我們去抨擊的地步?說真的,我還真不知。因為目前為止,還沒有人有系統性的做研究,也沒有收到太多的類似問題抱怨。

後記:

寫完文章之後,發現到網路上有一篇寫得不錯的文章可供讀者參考,這篇文章用AdWords的關鍵字查詢係統查出「女生很好把」的搜尋中,台灣真的不是最多的。很有趣的數字與分析:


>>對「Taiwanese girls are easy」這篇新聞報導內容的指正

沒有留言: