2015年4月7日 星期二

資料該怎麼開放?〔談實價登錄網站資料攔阻事件〕

原始發表時間:2012年11月15日

交易資料的查詢網站原本就不是資料交換/供應的良好方式,更值得關注的或許應該是,內政部是否規畫一個更好的開放資料供應方式?



今天一早打開電腦,就看到實價登錄地圖網站團隊在臉書粉絲頁上的抱怨。原來是政府的不動產交易實價查詢服務官網做了一個小動作,不讓外界去撈資料。

原本的官網資料都是以文字在呈現的,而現在「交易總價」、「交易單價」,以及「建物區段門牌」等三項關鍵的資料,改用圖檔顯示。這個小動作的目的很清楚,就是不要讓外界抓資料。




↑ 內政部不動產交易實價查詢服務網不但介面難用,而現在更以圖檔來呈現資料,

讓外界的開發者難以藉此取得資料。網路上怨聲載道!


. 恭喜內政部成功開倒車, 朝 open data 的 "反" 方向, 加速駛去!


〔案:粉絲頁上還有另一篇談慶功宴的文章有談到與此事件相關的一些技術問題,因為臉書貼文很難分享到臉書之外,所以請者自行上粉絲頁閱讀。〕


接著,上午網路上也開始「怨聲載道」,甚至一早就有部落客重砲批判:


. 和人民做朋友真的這麼難?民間版全台實價登錄網站的哀歌

甚至也開始有網路新聞在報導。


. 官方實價登錄網封鎖民間版? 開放資料突改圖檔不給抓


但這件事個人認為,大家或許都罵得太早了。實價登錄地圖網站開發團隊「水管」被切心中不滿可以體會,也值得大家對他們表達同情與鼓勵,而他們在粉絲頁上抱怨,也是人之常情。任誰都會這麼做。


但是身為媒體以及要評論一事對錯的部落客來說,是否應當對於事情做些基本的查證與深入瞭解呢?至少目前所見都只是一方之辭,另一方(內政部)那邊到底發生什麼事,我們「理所當然一定是如何如何」的下判斷是否允當?

至少,目前我們掌握到的官方消息,並不是網路上大家猜測的那個樣子。雖然還有許多細節還要問得更清楚些,也還有不同政府部門的人員要採訪。但大致方向是很清楚的:依法,開放資料必需經過申請與付費的程序。而這也是目前可能即將要發生的事。


請先冷靜!

麻煩看官不要看到「依法……」「付費」就跳起來開始亂罵一通。

請冷靜想想,「必需經過申請」與「付費」有什麼好處與壞處?是不是一個適當而良好的做法?

也請冷靜想想:弄個網站,讓人可以上去查資料,這就是「開放資料」嗎?特別是對於政府來說。

我認為不是的。

現在輿論多數把內政部的實價查詢網站等同於政府開放實價登錄這個資料(資料庫),然後大作文章。

但事實上,資料的開放不必然是要自己弄個網站給終端使用者使用,而反過來說,弄個網站給人使用也絕不能等同於開放資料。(現在機器人被攔了就很清楚有網站但資料不開放了!)

就政府的角色來說,比較適當的做法反而是提供一個友善的資料提供管道或方式,供第三方(民間)很容易使用這些資料去開發相關應用,這樣比較能夠釋放這些資料的價值與能量。 至於網站?現在不已事實證明民間開發的好太多了!

因此,政府目前正在著手的資料開放相關程序與做法,才是更值得觀察與分析的地方--對於資料開放這個議題來說

開個網站,讓開發者每天派機器人(bots)去爬搜資料,原本就不是良好的資料提供方式,這畢竟是為前端使用者而設計。對於開發者來說,應當還有許多其他更好的資料提供方式。

所以,現在內政部若只是在實價查詢網站弄個機制擋機器人不給爬搜資料,那麼就「開放資料」這件事來說,要論斷對錯還言之過早。甚至,我們站在對網站管理者同情了解的立場來說,見到機器人太多,想東想西最後弄個不是很好的機制來擋(不管你認為做法高不高明),也不需要罵得那麼難聽。

重點應該在於政府是否提供另一個更為友善而適當的資料提供方式?如果沒有,然後又把前端的資料攫取管道截斷,那根本就是在「封閉資料」。

而這也正是目前我們努力在求證的。

目前為止,我們所查證到的只是,可能很快就會公布這些地政開放資料的使用申請方式,費用則還沒查出來。只說「非常低」(至於多少是非常低也不知道)。

至於官網改以圖片式資料呈現資料,官方的回答大致上也都在我們預期之內:一堆機器人來爬資料,相當困擾……諸如此類的。〔至於這個做法適不適當,是不是處理機器人的良好做法?看官可以看看實價登錄地圖開發者的說明。〕

申請與收費制好不好?

雖然目前還不知細節上政府會怎麼做,要討論這個問題實在言之過早。但或許我們可以先思考與討論出一個較為合理可行的方向或期望。

個人認為,如果實施得當,申請與收費制其實利多於弊。至少會比目前讓開發者派機器人上官網爬資料來得好。

我們假設在技術層面上,內政部有提供一個資料開放標準程序,例如定期輸出一個打包好的資料供開發者截取,然後這個打包資料可以直接匯入其應用中,而且收取的規費又是開發者(特別是個人或是微型團隊)輕易負擔得起的,那麼對於應用的開發來說反而是更為友善的。

當然,規費收多少可能也會是關鍵,若收費只是象徵性的反應手序成本以及阻隔一些莫名其妙的人,那麼是可以接受的。但如果收得太高,恐怕會逼退個人開發者和迷你的開發團隊,打壓創新。

而「申請」則有利於政府掌握開發人員對於政府開放資料的應用。我們假設,有某些資料不適宜太大方的提供給中國或是外國開發者的,那麼這個「申請」的程序是否相當合理呢?

不過這也只是目前我個人的期望與設想。假使最後證明,政府前方殺你機器人兵團,後方用申請程序逼退開發人員,收了規費然後給爛資料,或者是偏私於特定團體……那麼,我們再努力罵他也不遲。

沒有留言: