統計名詞解釋

1 minute read

Published:

Ref:

  1. 統計學名詞(link)
  2. 甚麼是統計學(link)
  3. 基本的統計學名詞(link)

甚麼是統計學?

  • 是處理資料的科學,是一種研究方法,一種工具
  • 主要是處理不確定的問題;
  • 可用於政治、經濟、社會及教育問題以及自然現象

統計學的意義

  • 統計學是一種方法,一種工具。
  • 狹義的統計學是指以數字來表示事實或資料(data)
  • 廣義的統計學是指蒐集、整理、表現、分析及解釋資料,並藉科學的方法,在不確定情況下,由樣本資料所獲得的結果,來推論母體的性質與事實,從而做出適切決策的一門科學。

統計學分類

敘述統計學(descriptive statistics)

資料的收集、整理、呈現、解釋與分析等步驟,以數值、表格、圖表來描述資料概況的方法。

推論統計學(inference Statistics)

其係根據得自樣本的資料分析的結果來推測母群體的性質,做出合理的估計和推測,並陳述可能發生之誤差的統計方法。

有母數統計學

當母群體符合常態分配時所使用的統計推論方法。

無母數統計學

當母群體的資料分配不符合常態分配時,所使用的統計推論方法

應用統計學

是藉由推論統計方法,建立統計模型,利用統計模型做成決策之科學方法

數理統計學

重點在於闡明各種統計方法的原理

應用統計學

統計學的統計方法應用在各類科學研究與專門學術領域之應用

變量

依可數不可數來區分

連續變項(continuous variable)

  • 有許多心理特質或物理特質是成為一個連續不斷之系列的,而在這一連續不斷的系列上,任何一部份都可以加以細分,以得到任何的 值,或在其上面任何兩值之間,均可得到無限多介於兩者之間大小不同的值。
  • 連續變項既然是連續不斷的,故其值應視為一段距離,而不是一個點,故連續變項只是一個近似值。
  • 如:身高、體重、時間、智力商數等均為連續變項。

間斷變項(discrete variable)

  • 是一種只能取特殊的值,而無法無限取出任何值的變項,
  • 故間斷變項的一個值,是代表一個點而非一段距離且為精確數。
  • 每戶人家的孩子數、選舉的票數、桌子的張數、骰子的點數等。

根據 1951 年 Stevens 之分類

名義變項(nominal variable)

  • 又稱類別變項,係使用數字來辨認任何事物或類別之變項,其只說明某一事物與其他事物之不同,但並不說明事物與事物之間的差異大小和形式。
  • 如:座號 50 號之學生與座號 40 號學生之差並不能等於座號 30 號與 20 號之差,且座號 50 號並非座號 10 號的五倍。

次序變項(ordinal variable)

  • 可以依某一特質之多少或大小次序,將團體中各份子加以排列的變項。
  • 但次序變項僅表示方向次序,亦即僅描述份子與份子在某一特質方面的次序,並不描述份子與份子之差異的大小量。
  • 如:三位同學的作文得甲、乙、丙三個分數,僅能說明甲優於乙優於丙,但並不能說甲乙之差的量等於乙丙之差異的量,亦即乙減丙不等於甲減乙。
  • 此外,中位數、百分等級亦屬於次序變項。

等距變項(interval variable)

  • 除了可說明名稱類別和排列大小次序之外,還可計算出差別之大小量的變項,其基本特性為相等單位。
  • 如:28 度、30 度、32 度,不但可說明 32 度高於 30 度,且亦高於 28 度,並且可說明 32−30 =30−28。
  • 此外,平均數、標準差、積差相關亦屬於等距變項。

比率變項(ratio variable)

  • 除了可說出名稱類別、排列大小順序和計算差距之外,尚可說出某比率與某比率相等的變項。
  • 其最重要條件是具有絕對零點。
  • 如:重量 50 公斤是 10 公斤的五倍,且 10 公斤是 2 公斤的 5 倍,50:10 =10:2。

以描述表達觀點區分:

量的變項(quantitative variable)

又稱定量變項,描述不同數值,等距變項與比率變項屬之。

質的變項(qualitative variable)

  • 又稱定性變項,描述不同狀態,名義變項與次序變項屬之。
  • 以是否屬於社會學事實的觀點而言,可分為社會學變項與心理學變項:

社會學變項(sociological variable)

屬於社會學的事實,來自所屬團體的各種特性,如:社經地位、職 業。

心理學變項(psychological variable)

個體內在不可直接觀察的變項,通常是個人的意見、態度與行為。

時間序列

  • reference
  • 長期趨勢:由於某種根本原因的影響,客觀現象在一個相當長的時間內所呈現出來的持續增加或持續減少的一種趨勢和狀態。例如:隨著經濟條件、醫療條件的發展,人口出生率有高於死亡率的趨勢等。

  • 季節變動:由於季節的轉變而使時間序列發生週期性變化。這種週期性變化是以年為週期的可以預見的變化,因而反映季節變化的時間序列的數值資料所屬的時間一般以月、季、周等為單位,而不以年為單位。引起季節變化的因素有自然因素,也有人為因素。例如,由於自然氣候條件變化,使一些經濟現象呈現季節變動:蔬菜產量、食品價格、羽絨服銷量等。

  • 循環變動:循環變動是指時間序列以若干年為週期的波浪式變動。這種變動的特徵:現象的增加或減少交替出現,但持續的週期不因它的波動按任何既定的趨勢變化,而是按照某種不可預測方式進行漲落起伏波動,最典型的週期波動是商業週期。

  • 不規則變動:由於一些隨機因素的影響,而是時間序列產生的不可預測的不規則變動。

樓價指數

特徵定價模型

  • 價格指數編制中應遵循的“同質可比”的前提條件,因而需要進行“品質調整”,即在指數編制過程中剔除不同樣本(住宅單位) 之間的品質差異。
  • 可以用非同質的單位在基期與報告期之間進行比較,從價格的總變動中逐項剔除特徵變動的影響,最後剩下的便是純粹由供求關係引起的價格變動
  • 澳門所有樓價指數均以特徵定價模型計算,並得到兩組相關的樓價指數,分別為Laspeyres 指數和 Paasche 指數。綜合兩組指數幾何平均得出 Fisher 樓價指數。

人口

  • 人口自然增長
    • wiki
    • 人口自然成長率 = (年內出生人數 - 年內死亡人數) / 年平均人口數 × 100%= 人口出生率 - 人口死亡率

資產

  • wiki
  • 根據經濟周轉特性的不同,可以分為流動資產、長期投資、固定資產、無形資產和遞延資產等;
    • 流動資產:是指可以在1年或者超過1年的一個營業週期內變現或被耗用的資產,主要包括各種現金、銀行存款、短期投資、應收及預付款項、待攤費用、存貨等。這裡所講的“營業週期”,是指企業在正常的生產經營過程中從取得存貨、購買勞務一直到銷售商品和勞務,最後收取貨款和勞務款這一時間跨度。通常,商業企業的經營週期較短,製造業的經營週期較長,有的超過1年。
    • 長期投資:長期投資是指除短期投資以外的投資,包括持有時間準備超過1年(不含1年)的各種股權性質的投資、不能變現或不準備隨時變現的債券、其他債權投資和其他長期投資。
    • 固定資產:固定資產是指企業使用期限超過1年的房屋、建築物、機器、機械、運輸工具以及其他與生產、經營有關的設備、器具、工具等。
    • 無形資產:無形資產是指企業為生產商品或者提供勞務、出租給他人,或為管理目的而持有的,沒有實物形態的非貨幣性長期資產。
    • 遞延資產:遞延資產是指不能全部計入當年損益,應在以後年度內較長時期攤銷的除固定資產和無形資產以外的其他費用支出,包括開辦費、租入固定資產改良支出,以及攤銷期在一年以上的長期待攤費用等。
  • 根據存在的形態不同,可以分為金融資產與非金融資產,有形資產與無形資產。
    • 金融資產:金融資產是一切可以在有組織的金融市場上進行交易、具有現實價格和未來估價的金融工具的總稱。
    • 非金融資產:非金融資產指機構單位單獨或共同對其執行所有權或處置權,並通過在核算期內持有或使用它們可從中獲得經濟利益的,除金融資產以外的經濟資產。
    • 有形資產:有形資產有狹義的概念和廣義的概念之分。狹義的有形資產通常是指企業的固定資產和流動資金。廣義的有形資產則包括企業的資金、資源、產品、設備、裝置、廠房、人才信息等一切生產要素在內。總得來說,有形資產就是有一定實物形態的資產。

熵(entropy)

\[H(P)=\sum_x P(x) \log P(x)\]

其中,

\[0\leq H(P) \leq \log \vert X \vert\]
  • Reference 1
    • 結論1:如果沒有外部能量輸入,封閉系統趨向越來越混亂(熵越來越大)。比如,如果房間無人打掃,不可能越來越乾淨(有序化),只可能越來越亂(無序化)。
    • 結論2:如果要讓一個系統變得更有序,必須有外部能量的輸入。
    • 結論3:當一個系統(或部分)變得更加有序,必然有另一個系統(或部分)變得更加無序,而且”無序”的增加程度將超過”有序”的增加程度。
    • 如果沒有能量輸入,人類社會將變得越來越混亂(結論1);人類社會要變得更進步(有序化),必須要有能量輸入(結論2);這種”能量輸入”最好來自地球以外(比如太陽能)。如果只是使用地球上的能源,必然意味著在人類社會變得更有序的同時,地球的某個部分將變得更無序(結論3)。
  • Reference 2