2014年5月8日 星期四

5/02 筆記與心得

*公民參與(citizen participation)
意指人的一種行為與涉入過程,
其能主動參與一個方案、團體、組織(機構)或環境當中的決策,
這些包括影響他們的工作職場、醫療院所、鄰里、學校、宗教集會、社會等,
也有像致力於環境改造的 草根(grassroots)社區組織(community organizing)。
公民參與是一種減少心理疏離並增加知覺能力及控制感的良好方式。


*逗號分隔值
(Comma-Separated Values,CSV,有時也稱為字元分隔
值,因為分隔字元也可以不是逗號),其文件以純文本形式存儲表格數據(數字和文本)。純文本意味著該文件是一個字元序列,不含必須象二進制數字那樣被解讀的數據。
CSV文件由任意數目的記錄組成,記錄間以某種換行符分隔;
每條記錄由欄位組成,欄位間的分隔符是其它字元或字元串,最常見的是逗號或製表符。
通常,所有記錄都有完全相同的欄位序列。

CSV文件格式的通用標準並不存在,但是在RFC 4180中有基礎性的描述。
使用的字元編碼同樣沒有被指定,但是7-Bit-ASCII是最基本的通用編碼。
CSV檔案大小比原本Excel檔的還要小



*Tim Berners-Lee’s 5 star system

用一個開放的授權,讓你手上的資料(任何資料格式)在網路上可以被取得
使這個資料被取得時是一個結構化的資料 (如,用Excel取代掃瞄的表格)

使用非專屬格式(如,CSV取代Excel

使用 URIs 來表達資料中,所以其它人可以點出你的資料的在資料網絡中的位置

鏈結你的資料到其它資料以提供資料之間脈胳關係,如相等(owl:sameAs)



*The Sunlight Foundation’s 10 principles 政府資訊開放的十個原則
1完整性
政府發布的數據集應盡可能完整,反映了所記錄下來的有關特定主題的全部內容。從數據集中的所有原始信息應該向公眾發布,但為遵守聯邦法律有關的個人身份信息的發布必要的範圍內。元數據定義和解釋原始數據應包括在內,連同公式和解釋如何得出的數據進行計算。這樣做將允許用戶了解信息提供的範圍和檢查每個數據項在細節的最大可能的水平。

2首要地位
政府發布的數據集應該是主要的源數據。這包括由政府所收集的原始信息,關於數據如何被收集的信息和原始源文件記錄的數據的集合。公共傳播將允許用戶驗證信息正確收集並記錄準確。

3時效性
政府發布的數據集應該是向公眾提供及時。只要可行,由政府收集的信息應盡快發布,因為它是收集和回收。應優先考慮到數據的工具對時間很敏感。實時信息更新將最大限度地發揮效用市民可以從這些信息中獲得。

4物理與電子訪問的易用性
政府應該訪問盡可能與定義為難易程度信息獲取發布的數據集可以得到,無論是通過物理或電子方式。障礙的物理訪問,包括要求親自拜訪或要求某特定職位,以符合特定的程序(如填寫表格或提交FOIA要求) 。壁壘自動化的電子存取包括使數據通過,需要瀏覽器為導向的技術(例如,閃存,使用Javascript , Cookie或Java小程序)的形式提交或系統只訪問。相比之下,為用戶下載所有儲存在一次(被稱為“散”訪問) ,並通過一個應用程序編程接口,使數據的特定呼叫( API),使數據更容易的方法數據庫中的信息的接口訪問。 (這種情況的一個方面是“可查找性”,這是很容易的定位和下載內容的能力。 )

5機器可讀性
機器可以處理某些類型的投入比別人更好。例如,在紙上手寫的筆記是非常困難的機器來處理。通過光學字符識別(OCR )掃描結果中的文本很多匹配和格式上的錯誤。信息的廣泛使用的PDF格式共享,例如,是非常困難的機器解析。因此,信息應該存儲在廣泛使用的文件格式,容易進行機械加工。 (當其他因素需要使用的難以解析的格式,數據也應該可以在機器友好的格式。 )這些文件應附有有關的文件的格式以及如何使用它有關的數據。

6非歧視
“非歧視”是指誰可以訪問數據,他們必須怎麼做。障礙使用的數據可以包括註冊或會員的要求。另一個障礙是“圍牆花園”,這是只有一些應用程序被允許訪問數據時的用途。在其最廣泛的,數據無歧視接入意味著任何人都可以訪問在任何時候的數據,而無需識別他/她或提供任何理由這樣做。

7共同所有標準的使用
共同擁有的(或“打開” )的標準指的是誰擁有在其中存儲數據的格式。例如,如果只有一家公司生產,可以讀取存儲數據的文件,訪問該信息的程序取決於使用該公司的加工程序時。有時,該程序無法使用公眾不惜任何代價,或者是可用的,但是是收費的。例如, Microsoft Excel是一個相當常用的電子表格程序,它的成本錢使用。可自由查看的其他格式往往存在其中存儲的數據,而不需要一個軟件許可證進行訪問。刪除此成本使得提供給潛在用戶更廣泛池中的數據。

8許可證
實行“服務條款”,署名要求,對傳播的限制等作為屏障,以公眾使用的數據。最大的開放性包括清楚地標記的公共信息是政府和可用的工作,而對作為公共領域的一部分限制。

9 持久性
查找信息隨著時間的能力被稱為持久性。政府網上發布的信息應該是粘:它應該是永久性的檔案在網上提供。很多時候,信息的更新,更改或刪除,沒有任何跡象顯示改變已經取得進展。或者,它是由作為數據流,但不存檔的任何地方。對於所提出的公開,信息最好使用可在網上應該保持在線狀態,用相應的版本跟踪和存檔隨著時間的推移。

10使用成本
其中以獲得表面上是公開資料的最大障礙是強加於公眾訪問的成本 - 即使成本最低豁免。政府使用了一些基地,向市民收取訪問自己的文件:創建信息的成本;在成本回收的基礎上(成本生產由購買者的預期數量劃分的信息) ;的成本來檢索信息;每個頁面或每個查詢的成本;加工成本;重複等費用










沒有留言:

張貼留言