信息化和人工智能時代，我們應該如何找到目標信息？查找目標信息系列之二

一、資訊化時代和人工智慧時代的個人資訊狀況#

我們正處於一個資訊化的時代。隨著全球聯繫日益緊密，以及人們日益追求快速高效地處理各種問題，在計算機、互聯網、交通通訊等各種技術高速發展的情況下，人們生活、工作、學習的各個方面，都快速地創建 / 發現、傳播、存儲、研發各種資訊，都在參與構建和發展資訊化時代。簡單說，技術發展，讓我們可以將各種認識按照一定的規則編碼排序。而資訊的快速流通和傳播，也促使了虛假或錯誤資訊的流傳，最終容易使人處於一種資訊蟲繭而愈發封閉的境地。

於此同时，我們也開始邁入人工智慧時代。由於人工智慧技術的限制，目前的人工智慧還沒有達到通用人工智慧的水平。因此，人工智慧如 ChatGPT-3.5，在回答問題時，通常會胡編亂造一些數據或資訊，讓使用者陷入人工智慧說的好像是對的 “幻覺” 之中。例如，之前一段時間，在問 ChatGPT-3.5，“為何魯迅和周樹人打架？”，她會回答，這是因為兩人產生了分歧，如此種種。而在問 “愛蓮說的作者是誰？”，她會回答說：是楊萬里；有時會回答是張愛玲等。不過，這些問題，隨著 ChatGPT 調用的中文數據越來越多之後，這類問題會被糾正，並出現的次數會逐漸減少，但仍然無法排除人工智慧產生 “幻覺” 的可能。因此，在利用人工智慧的同時，而不被其 “幻覺” 所產生的錯誤資訊誤導，也是我們需要關注的問題。

二、基於資訊得到的查詢資訊的基本原則#

在互聯網和手機通訊（包括即將盛行的衛星通訊）行業高速發展的帶動下，資訊的產生、存儲、利用、發現新資訊的速度變得更快。但虛假的信心也會因為便捷的流通而快速滲透到人們的生活、學習的各個方面。再加上人工智慧技術的待完善所產生的 “幻覺” 或錯誤，以及某些人工智慧根據用戶偏好推送類似資訊的推送規則，如何保證自己不被資訊海洋淹沒或不造成資訊蟲繭而愈發封閉，使自己得到的資訊有偏差甚至完全失實，找到解決現實問題所需的目標資訊，對於提高個人的認知和能力，就顯得尤為關鍵和重要。

如果要查找有用的資訊，我們要先明白資訊流通的基本模式以及資訊的基本載體（見我的這篇文章）。基於資訊的本質可知，資訊是人們對其關於世界和人的認知進行一種編碼。而編碼準許的基本原則是：（對人或人類而言的）有用性。基於我們對資訊本質和流通模式的分析可知：資訊作為編碼過的認識，其流通遵循創造或發現、存儲、流通、利用、產生新的資訊，如此循環往復；而資訊主要載體主要包括語音、文字、圖片、視頻、全息影像等等。認識資訊的本質、基本流通模式和承載資訊的載體之後，可以方便我們更好地、快捷高效地查詢到有用的、自己想要的資訊。

（一）基於資訊編碼原則的啟示#

查找最有價值的資訊源和存儲點。由於資訊是根據有用性來編碼，那麼，我們在查找資訊時，就可以根據需要查找的資訊，並定位資訊所處於的學科、行業、部門等，並通過對應的學科、行業和部門精準地獲取所需的資訊。例如，查詢一瓶化妝品某個元素的含量（未注明這個成分所含比例），那麼，就可以根據產品的編號和這種化妝產品必須遵循的標準來看這個成分含量的基準值，任何誇大或縮小都可以核實。同樣，如果要查哲學領域某個教授的文章，那麼，就可以根據他所在學校網站的介紹、個人網站、郵箱或專業的哲學類網站如https://philpapers.org/查詢，如果需要下載詳細資訊，可以使用學校購買的外文期刊庫來下載或者使用類似於Sci-hub的工具來下載文章。如果要查詢企業管理者經營狀態或是否是失信人員，可以通過企查查、天眼查、企信寶等工具查詢，藉此，可以查詢到公司基本資訊、經營資訊、經營風險等等。例如查詢 “恆大”，就可以查詢到其股東 “廣州市凱隆置業有限公司” 成為 “被執行人”，而該公司法定代表人韓雪則被 “限制高端消費”（查詢時間：2024 年 1 月 31 日）。

（二）基於資訊流通模式的啟示#

1. 就資訊源而言，我們需要找到權威可靠的資訊源#

資訊的流通，最重要的是新資訊的產生。由於人人都可以成為資訊產生的源頭，各種資訊的傳播似乎都有自己的合理理由和存在方式，因此，在查詢資訊時，就需要辨別哪些資訊是更有價值或更可靠。就資訊源而言，我們需要明晰，通常針對某個問題，我們需要找到這個領域的專家或大牛。為避免某個專家的偏見帶來的資訊誤差，有必要多參考同級別專家的觀點和意見，最終自己形成自己的觀點。

2. 就資訊流通的存儲而言，需要根據存儲方式的不同而改變查詢方式#

不同的資訊，會以不同的載體存儲。例如，圖片會以圖書、膠卷、電子化圖片的形式存儲等，而視頻則可以光碟、U 盤、移動硬碟、NAS 等存儲。因資訊存儲方式不同，查詢資訊的途徑也會不同。

當然，就資訊存儲而言，目前人們通常習慣將資訊電子化。因此，查詢資訊時，首先要會查詢已經電子化的資訊。就此，我們需要善於利用以Google為代表的探索引擎、以wiley、谷歌學術、PubMed、Web of Science、知網等為代表的學術文章收集、統計工具，以Nature、Science等雜誌為代表的專業期刊、以Github、Stack Overflow、ResearchGate等為代表的專業社區等，以及以Coursera、edX為代表的在線教育平台。與此同時，要利用諸如ChatGPT-4、Bard為代表的文本生成式的人工智慧和以elicit、scinapse、semanticscholar、chatpdf等為代表的人工智慧文獻分析工具等。當然，在使用人工智慧的服務時，需要格外小心，盡量要審核資訊的真偽，保證資訊的有效性和有價值。可以參考Snopes或factcheck或根據某個行業的標準、詞典、專家意見等來核實。

對於許多還沒有電子化的資訊，我們需要更深入的探尋。例如，對於歷史上的圖片、文字等資訊，如果互聯網上並沒有收錄或發現，那麼，通常可以通過以下方法來實現：訪問公共圖書館或檔案館或者大學、其他研究機構的特殊館藏，或者訪問該圖片所涉及的歷史學家或研究者，查詢該圖片所在地方的社會歷史地方資料檔案館，或者訪問數位化的博物館的數位收藏，或者通過查詢相關書籍來查詢。

3. 就資訊的利用而言，查詢資訊時，我們需要首先定位該資訊最權威的機構#

不同的人或機構對資訊審核、選擇、使用、存儲的機制不同。通常，越是專業化的、大型的機構，其挑選資訊，越會遵循嚴格的標準，保證獲取的資訊是精準、可靠而有效的。因此，查詢資訊時，直接在這些領域的專家或專業機構，會省去我們走很多彎路。

例如，對於人工智慧的研發，通常我們可以在大型的公司如 Google、亞馬遜、微軟等得知人工智慧領域最新、最先進的研發資訊，當然，也可以在諸如斯坦福大學、MIT 等大學或研究機構得知最可靠的資訊。查詢國內的人工智慧研發情況，思路大體如此。

4. 資訊的研發、利用要遵循科學的原則#

資訊的研發和利用，雖然不是資訊查詢的步驟，但是卻會影響下次資訊查詢的效果。因此，有必要強調，在研發、利用資訊時，要遵循科學研究的精神和原則，盡量符合事實地和語境地使用資訊、產生新的資訊。

三、總結#

綜述所述，查詢資訊的關鍵在於，在明晰資訊的本質和流通模式、規律之後，我們首先要定位資訊所在的領域，並找到該領域最權威、核心的資訊源。這源泉包括而不限於專家、教授、研究者或大型公司或研究機構、學術機構等等。然後，充分利用電子化資訊探索工具和非資訊化查詢途徑，我們便可以很快找到高質量的、可靠、有效的目標資訊。

後續，我將分門別類地列舉一些我收集、分析的資訊收集、存儲、利用的工具。敬請期待。

本文原文發布於 2024 年 1 月 19 日，此處存檔一份。