又大又硬又爽又粗又快的视频免费|男人扒开添女人下免费视频|欧美日韩视频免费播放|美女扒开屁股让男人桶视频免费

  • <dl id="qmwet"><ins id="qmwet"></ins></dl>
    <sup id="qmwet"><menu id="qmwet"></menu></sup>
  • <input id="qmwet"></input>
    <sup id="qmwet"><menu id="qmwet"></menu></sup>
  • 返回
    頂部

    Stata 18—數據統計分析軟件包

    Stata安裝手冊 獲取報價 軟件試用 官網授權

    軟件簡介


    2023年4月25日 Stata 18 全新版本正式上線!它有許多令人興奮的新功能,包含20個亮點! Stata 是一套提供其使用者數據分析、數據管理以及繪制專業圖表的完整及整合性統計軟件。它功能非常強大,包含異質性DID、中介效應、多向聚類標準誤、野聚類自助法、工具變量分位數回歸、貝葉斯模型平均、描述性統計制表等功能。用 Stata 繪制的統計圖形相當精美。Stata 具有操作靈活、簡單、易學易用、運行速度極快等優點。 <<點擊了解詳情。

    Stata相關活動集錦


    近期Stata軟件相關培訓

    >> 2023 第七屆 Stata 中國用戶大會

    >>2023 Stata夏季訓練營(現場班)

    >>【友萬課堂】2023年3-5月 Stata 在線免費網絡研討會

    >>【會議資訊】2023年 Stata 全球會議

    【友萬課堂】使用網絡方法研究經濟學問題網絡研討會

    機器學習與Stata、R應用研討會-陳強教授主講

    Stata 空間計量與機器學習研討會-王群勇教授主講

    了解更多


    近期Stata軟件相關新聞

    >> 熱烈祝賀“第七屆Stata中國用戶大會”在哈爾濱商業大學成功舉辦并取得圓滿成功

    >> 2023 Stata夏季訓練營 第三期“宏觀計量經濟模型研討會”圓滿結束!

    >> 2023 Stata夏季訓練營 第二期“異質性穩健DID及Stata應用專題研討會”圓滿結束!

    >> 2023 Stata夏季訓練營 第一期“面板數據與因果推斷專題研討會“圓滿結束!

    >> Stata 18 正式發布,20個新功能亮點!

    了解更多


    Stata軟件相關技術文章

    >> 【Stata視頻】Stata 18新功能:巧用21個新亮點視頻合集(下)

    >> 【Stata視頻】Stata 18新功能:巧用21個新亮點視頻合集(中)

    >> 【Stata視頻】Stata 18新功能:巧用21個新亮點視頻合集(上)

    【Stata18 新功能】用新的 dtable 命令創建描述性統計表

    【Stata18 新功能】一個可以運行Tg-1的Stata命令

    【Stata18 新功能】面板VAR模型及應用

    了解更多


    Stata校園行活動火熱招募中

    Stata實驗室建設計劃,優化人才培養,助力社會前行!



    • Stata 18 新功能
    • Why Stata?
    • 功能版本介紹
    • 軟件詳細功能
    • 系統要求
    • Stata中國用戶會議
    • 原廠相關資源
    • Stata系列課程
    • Stata案例集

    What's new in

    • 1. Bayesian model averaging (BMA) (貝葉斯模型平均)
    • 2. Causal mediation analysis (中介效應分析)
    • 3. Heterogeneous DID (異質性 DID)
    • 4. All-new graph style (全新的畫圖風格)
    • 5. Tables of descriptive statistics (描述性統計制表)
    • 6. Alias variables across frames (別名變量 across frames)
    • 7. Group sequential designs (成組序貫實驗設計)
    • 8. Multilevel meta-analysis (多層次元分析)
    • 9. Meta-analysis for prevalence (患病率的元分析)
    • 10 .Robust inference for linear models (線性模型的穩健推斷)
    • 11 .Wild cluster bootstrap (野聚類自助法)
    • 12 .Relative excess risk due to interaction(RERI) (交互作用相對超額風險度)
    • 13 .TVCs with interval-censored Cox model (TVCs 和區間刪失 Cox 模型)
    • 14 .Lasso for Cox model (Cox模型的拉索法)
    • 15 .GOF plots for survival models (生存模型的GOF plots)
    • 16 .Local projections for IRFs (IRFs 的局部投影法)
    • 17 .Model selection for ARIMA and ARFIMA (ARIMA和ARFIMA的模型選擇)
    • 18 .Flexible demand system models (靈活的需求系統模型)
    • 19 .IV quantile regression (IV分位數回歸)
    • 20 .IV fractional probit model (IV fractional probit 模型)
    • 21 .Data Editor enhancements (數據編輯器的改進)
    • 22 .Do-file Editor enhancements (Do 文件編輯器的改進)
    • 23 .Corrected and consistent AIC (更正一致性AIC)
    • 24 .New spline functions (新的樣條函數)
    • 25 .Vectorized numerical integration (矢量數值積分)
    • 26 .Boost-based regular expressions (基于 Boost 的正則表達式)
    • 27 .New reporting features in putdocx, putexcel, and putpdf (putdocx、putexcel 和 putpdf 中新報表功能)
    • 28 .Graph colors by variable (按變量劃分的圖表顏色)
    • 29 .Frame sets (框架組)
    • more


    Stata 18 新功能介紹

    • 1. Bayesian model averaging (BMA) (貝葉斯模型平均) 點擊查看相關視頻

      一般來說,你會選擇一個模型并基于這個模型進行分析。這些結果是以所選模型為條件的。在存在多個合理的模型時,這種方法可能不可靠。
      模型平均法允許你在多個模型的基礎上進行分析,從而在結果中考慮到模型的不確定性。
      BMA根據貝葉斯原則對模型的不確定性進行核算,可以普遍應用于任何數據分析。
      在回歸設定中,模型的不確定性描述了哪些預測因子應該包括在回歸模型中的不確定性。
      新的命令 bmaregress 可以執行線性回歸的 BMA,并可用于推理、 預測,如果需要的話,甚至可以用于模型選擇。比如說,
      . bmaregress y x1 x2
      考慮包括或不包括預測因子x1和x2的結果y的所有四種可能的模型,并根據每個模型在觀察數據基礎上的可能性結合這些模型。你可以從各種先驗分布中選擇,以探索關于模型和預測者的重要性的假設對結果的影響。
      Postestimation 命令允許你估計一個模型的概率,識別重要的預測因子,探索模型的復雜性,獲得預測手段,評估預測性能,并對回歸系數進行推斷。
      使用線性回歸,bmaregress 對線性回歸模型進行 BMA,使研究人員能夠考慮到應該使用哪些預測因子的不確定性。

    • 2. Causal mediation analysis (中介效應分析) 點擊查看相關視頻


      因果推理的目的是識別和量化治療對結果的因果效應。在因果關系分析中,我們旨在進一步探索這種效應是如何產生的。也許運動可以提高一種激素的水平,而這種激素反過來又可以提高幸福感。也許進口配額增加了當地公司的市場力量,反過來又增加了商品的價格。 我們經常用因果圖來顯示這樣的關系,比如說


      利用新的 mediate 命令,我們可以估計治療對結果的總效應,并將其分解為直接效應和間接效應(通過中介如荷爾蒙水平)。事實上,可以計算多種類型的分解,這取決于感興趣的假設。此外,estat proportion 報告了通過中介物發生的總效應的比例。 mediate 是非常靈活的--結果可以是連續的、二進制的或計數的;mediator 可以是連續的、二進制的或計數的;而治療結果可以是二進制的、多值的或連續的。 mediate 是命令非常靈活的,它支持結果和調解人的24種模型組合,所以它可以應用于實際研究中出現的許多情況。


    • 3. Heterogeneous DID (異質性 DID) 點擊查看相關視頻


      DID 模型是用來估計重復測量數據對被治療者的平均治療效果(ATET)的。治療效果可以是藥物治療對血壓的影響或培訓計劃對就業的影響。與現有的teffects命令提供的標準橫斷面分析不同,DID 分析在估計 ATET 時控制了組和時間效應,其中組是重復測量的。
      異質性 DID 模型還考慮了因群體在不同時間點接受治療而產生的治療效果的變化,以及群體內效果隨時間變化的情況。
      假設幾個學校引進了一項運動和營養計劃,以改善學生的健康狀況。該計劃對學生健康結果的影響不隨時間變化,而且無論何時采用該計劃都是一樣的,這是否合理?也許不是。我們可以使用異質性 DID 模型來解釋潛在的效果差異。
      新的命令 hdidregress 和 xthdidregress 適用于異質 DID 模型。hdidregress 適用于重復截面數據,xthdidregress 適用于縱向/面板數據。
      異質性 DID 是最近世界各地許多 Stata 會議上的一個熱門話題?,F有的用戶可能會對這個新增功能感到非常興奮。


    • 4. All-new graph style (全新的畫圖風格) 點擊查看相關視頻

      Stata 18 中的 graph 有了新的外觀!
      新的默認圖形方案(或 Stata 圖形的新外觀)包括以下備受期待的功能:
      1.白色背景
      2.更新的調色板,色彩明亮
      3.水平 y 軸標簽
      4.寬高比
      5.某些圖形的動態圖例放置
      6.還有更多
      作為一個例子,新方案中的條形圖現在就像下面一樣:


      從而代替了以下舊條形圖:



      事實上,我們引入了四種新的圖方案:stcolor、stcolor_alt、stgcolor和stgcolor_alt。新的默認為 stcolor,其他方案是 stcolor 的變體,提供不同的寬度和圖例位置。


    • 5. Tables of descriptive statistics (描述性統計制表) 點擊查看相關視頻


      新的 dtable 命令創建一個描述性統計表。
      dtable 報告連續和分類因素變量的匯總統計。你可以選擇你想為每個變量報告的統計數字;從平均數、標準差、中位數、四分位數范圍、百分比、比例和許多其他數據中選擇。你還可以輕松地比較另一個變量的不同類別的統計數據。
      由 dtable 創建的表格可以在許多方面進行定制--要報告的統計數據、數字和字符串格式、注釋、標題、標簽等等。表格可以直接導出到 Microsoft Word 、MicrosoftExcel。HTML。Markdown,PDF。LaTex SMCL. 或純文本。
      dtable 命令使創建那些通常被稱為 "表1 "的表格變得很容易-幾乎每篇研究論文中都有第一個表格。


    • 6. Alias variables across frames (別名變量 across frames) 點擊查看相關視頻


      從 Stata 16 開始,Stata 就支持內存中的多個數據集。每個數據集都駐留在一個 frame 中。當數據集是相關的,你可以通過使用 frlink 命令來鏈接它們的 frame,并確定當 frame 中的觀測值與相關 frame 中的觀測值相匹配的變量。
      在 Stata 18 中,你可以使用新的 fralias add 命令來創建跨鏈接 frame 的別名變量,并輕松地使用存儲在不同 frame 中的變量進行分析。
      別名變量的行為就像你把它們從一個 frame 中復制到另一個 frame 中一樣,但是由于它們被存儲在原始 frame 中,所以它們占用的內存非常小。
      要查看別名變量的使用很容易,請假設 y 是當前 frame 中的一個變量,并且 x 可以從名為 frame2 的鏈接中獲得。要在當前 frame 中創建x的別名,請輸入:
            . fralias add x, from(frame2)
      然后,您可以通過輸入:
            . regress y x
      就像 x 被存儲在當前 frame 中一樣。


    • 7. Group sequential designs (成組序貫實驗設計) 點擊查看相關視頻

      GSDs 是一種適應性設計,允許研究人員在發現某種治療方法有效或無效的有力證據時提前停止試驗。
      假設我們想設計一項研究來檢驗某種類型的化療對治療腫瘤是否有效,并且我們希望在幾個月的時間里收集數據。GSDs 允許我們在收集數據時進行中期分析,而不是在收集完所有數據后進行一次分析。每個中期分析都提供了停止試驗或繼續收集數據的機會。如果有強有力的證據證明療效,試驗可以提前停止。如果有強有力的證據表明試驗是無效的,試驗也可以提前停止;這樣可以避免讓更多的參與者接受不適當的治療。
      Stata 18 為 GSDs 提供了一套命令。新的 gsbounds 命令可以根據分析的數量(也叫looks)、期望的總體 Type I 誤差和期望的功率來計算療效和效用界限。新的 Gsdesign 命令可以計算療效和無效邊界,并提供中期和最終分析的樣本量,以測試平均值、比例和生存函數。 Graphs 使所有中期和最終分析的界限更容易直觀化。
      這個工具對用戶非常友好。syntax 命令遵循我們對 power 命令的直接 syntax。通過點選界面可以很容易地獲得結果。樣本大小的計算可以擴展到均值、比例和生存函數的測試之外,因為用戶可以指定一個用戶定義的方法,這些通過 gsdesign 隨時可用。
      任何設計臨床試驗的人都會對此功能感興趣,這可以擴展到臨床心理學家和其他醫學研究人員。


    • 8. Multilevel meta-analysis (多層次元分析) 點擊查看相關視頻


      當研究人員想要分析來自多個研究的結果時,他們會使用元分析來合并結果并估計總體效應大小?,F有的 meta 套件被用來進行標準和多變量的元分析。
      有時報告的效應大小被嵌套在更高層次的分組中,如地理位置(州或國家)或行政單位(學區)。同一組內(例如,區)的效應大小很可能是相似的,因此具有依賴性。在這種情況下,你可以使用多層元分析。多層元分析的目標是不僅要綜合總體效應大小,而且要考慮到這種依賴性,并評估不同層次的效應大小之間的變化。新的估計命令 meta meregress 和 meta multilevel 是用來進行多層元分析的。
      假設我們有研究報告了兩種教學方法對數學考試成績y和y的抽樣標準誤差的影響(平均差異)。影響大小嵌套在學校內,學校嵌套在地區內。我們可以用
            . meta meregress y || district: || school:, essevariable(se)

            . meta multilevel y, relevels(district school) essevariable(se)
      如果我們有協變量并想要包括隨機斜率,我們可以使用meta meregress:
            . meta meregress y x1 x2 || district: x1 x2 || school:, essevariable(se)
      擬合模型后,后估計命令可用于計算多層次異質性統計,顯示估計的隨機效應協方差矩陣等。 Syntax 命令是目前所有軟件包中最簡單的。meta meregress 在可以應用于隨機效應的約束方面也是最靈活的。


    • 9. Meta-analysis for prevalence (患病率的元分析) 點擊查看相關視頻


      meta esize 命令對兩個樣本的二元或連續數據進行元分析,現在,它也對一個樣本的二元數據進行元分析,也被稱為比例的元分析或流行率的元分析。
      這些類型的數據通常出現在元分析研究中,當匯集來自各估計一個比例的研究結果時。例如,你可能有研究報告某種疾病的流行率或高中輟學學生的比例。在這種情況下,效應大小,如Freeman-Tukey轉換的比例或 logit 轉換的比例,通常在元分析中使用。
      在 meta esize 之后,使用 meta 套件中的其他命令進行進一步分析。例如,用 meta forestplot 創建森林圖,通過將 subgroup()選項添加到元森林圖來執行亞組分析,使用 meta summarize 匯總元分析數據,或者使用meta funnelplot構建漏斗圖。
      患病率的元分析是最常見的用戶要求添加到我們的元分析套件中。許多用戶期待著對這種性質的研究進行分析。


    • 10. Robust inference for linear models (線性模型的穩健推斷) 點擊查看相關視頻


      正確的標準誤對于在研究中得出適當的推論至關重要。
      Stata 18 為 regress、areg 和 xtreg、fe 的線性模型提供了獲得標準誤差和置信區間的新方法。新方法的目的是在大樣本近似法效果不佳時提供更好的推理。也許你的聚類數據只有幾個聚類,或者每個聚類的觀測值數量不均勻。您現在可以添加 vce(hc2-clustervar)選項來獲得 hc2 聚類穩健標準誤。也許你有一個以上的變量來識別你的數據中的聚類,你現在可以添加 vce(cluster clustvar1 clustvar2 ...)選項來獲得多向聚類標準誤。
      最近,社交媒體上有許多關于在各種情況下標準誤的最佳選擇的熱烈討論。


    • 11. Wild cluster bootstrap (野聚類自助法) 點擊查看相關視頻


      當研究人員有幾個集群的數據、集群之間的觀測數量不均衡或兩者兼有時,野聚類自助法為穩健推理提供了另一個新的選擇。 新的 wildbootstrap 命令計算了用于檢驗線性回歸模型參數的簡單和復合線性假設的野聚類自助法 p 值和置信區間。你可以輸入
            . wildbootstrap regress y x1 x2 …

            . wildbootstrap areg y x1 x2 …, absorb(x3)

            . xtset id
            . wildbootstrap xtreg y x1 x2 …
      來分別擬合線性回歸模型、帶有大量虛擬變量集的線性回歸模型或面板數據的固定效應線性回歸模型,并獲得野聚類自助法統計數據。
      這與上述新的標準誤差很好地結合在一起,為用戶提供了許多新的工具,用于線性模型中的穩健推斷。


    • 12. Relative excess risk due to interaction(RERI) (交互作用相對超額風險度) 點擊查看相關視頻


      流行病學家經常需要確定兩種暴露是如何相互作用的,使受試者經歷一個感興趣的結果的風險更高。例如,你可能想研究香煙煙霧和石棉的暴露如何相互作用,增加肺癌的風險。使用新的 reri 命令,你可以在相對風險的加性模型中測量雙向的相互作用,同時考慮到其他的 風險因素。
      研究人員可以從各種支持的模型中選擇,如 Logistic、二項廣義線性、泊松、負二項、Cox、參數生存、區間刪失的參數生存和區間刪失的Cox模型。他們可以通過使用三個相關的統計數據:RERI、可歸屬比例和協同指數來評估煙霧和石棉的相互作用的加性模型。
      用戶群體:流行病學、醫學和健康研究人員。


    • 13. TVCs with interval-censored Cox model (TVCs 和區間刪失 Cox 模型) 點擊查看相關視頻


      在事件-時間數據中,當一個感興趣的事件(如癌癥復發)的時間沒有被直接觀察到,但已知位于一個區間內時,就會發生區間刪失?,F有的 stintcox 命令適合半參數區間刪失的Cox比例風險模型。在 Stata 18 中,stintcox 允許隨時間變化的協變量。
      stintcox 現在支持每個受試者間隔多個記錄的審查數據,其中包括每個受試對象每個檢查時間的記錄。這種格式可以很容易地適應時變協變量;數據記錄了每個檢查時間的協變量的值。每個受試者的多個記錄數據也提供了指定當前狀態數據的方便方法。
      stintcox 還提供了新的選項 tvc(varlist_t)和 texp(exp),這兩個選項提供了一種方便的方式來包括時間迭代協變量,這些協變量是由 tvc()中指定的協變量與 texp()中規定的時間的不確定性函數之間的相互作用形成的。
      擬合一個模型后,標準和特殊利益的后評估功能可用,并適當地考慮時間變化的協變量。你可以使用新的 estat gofplot 命令來產生一個擬合的良好性圖。你可以預測相對危險度。你可以使用 stcurve 來繪制生存者和相關函數。當你有多個記錄數據時,你可以使用新的 stcurve 選項 attmeans 來評估協變量的特定時間均值的函數,或者使用新的選項 atframe(framename) 來評估 framename 中指定的變量值的函數。
      真正的半參數模型是對區間刪失的事件-時間數據的建模,直到近年來方法上的進步,這些進步在 stintcox 命令中實現。方法上的進步還體現在對時變協變量的擴展上,現在這個命令中就有這些擴展。
      用戶群體:任何對生存期或持續時間分析感興趣的人,如生物統計學、經濟學(作為持續時間分析的一部分)、流行病學、醫學、政治學、機構研究或健康方面的研究人員。


    • 14. Lasso for Cox model (Cox 模型的拉索法) 點擊查看相關視頻


      當我們有許多潛在的協變量時,我們使用 lasso 進行預測和模型選擇。(當我們說很多的時候,我們指的是幾百個,幾千個,甚至更多。)我們以前介紹過 lasso 命令,對線性、logit、probit 和 Poisson 模型進行 lasso。在 Stata 18 中新增了用于 Cox 比例危險模型的 lasso。lasso cox 可以用來用套索選擇協變量,并對生存時間數據擬合 Cox 模型。 elasticnet cox 同樣可以用來用彈性網選擇協變量并擬合 Cox 模型。 在 lasso cox 和 elasticnet cox 之后,你可以使用 predict 來預測危險比;使用 stcurve 來繪制生存函數、危險函數或累積危險函數;或者使用 lasso 和 elasticnet 之后的任何其他后估計工具來檢查 lasso 的結果。
      用戶群體:任何對生存期或持續時間分析感興趣的人,如生物統計學、經濟學(作為持續時間分析的一部分)、流行病學、醫學、政治學、機構研究或健康方面的研究人員。


    • 15. GOF plots for survival models (生存模型的GOF plots)


      Stata 18 提供了新的estat gofplot命令來生成生存模型的擬合優度 (GOF) 圖。您可以在四個生存模型之后使用它:右刪失 Cox ( stcox )、區間刪失 Cox ( stintcox )、右刪失參數 ( streg ) 和區間刪失參數 ( stintreg )。檢查分層模型后的模型適合度或分別針對每個分組。
      GOF 圖可以直觀地檢查模型與數據的擬合程度。在生存分析中,這些檢查基于所謂的 Cox–Snell 殘差和假設,如果模型是正確的,這些殘差應該具有標準的指數分布。從視覺上看,這個假設是通過根據估計的累積風險繪制殘差來評估的——繪制的值越接近 45° 線,擬合越好(Cox 和 Snell 1968)。
      o 參數和半參數生存模型
      o 右刪失和區間刪失數據
      o 累積風險函數的三個估計量
      o 按組和分層模型


    • 16. Local projections for IRFs (IRFs 的局部投影法) 點擊查看相關視頻


      新的 Ipirf 命令提供了 IRFS 的局部投影。在時間序列分析中,局部投影法被用來估計沖擊對結果變量的影響。例如,我們可以評估利率的意外變化對一個國家的產出和通貨膨脹率的影響。
      你可以輸入:
            . lpirf y1 y2
      以獲得 y1 和 y2 的 IRFS 的局部投影估計。您可以添加 exog()選項來估計動態乘數,這是內生變量對外生變量沖擊的反應。
      新的 lpirf 命令與現有的 irf 命令無縫配合,允許您創建 IRFS、正交 IRFS 和動態乘法器的圖形和表格。
      與上面提到的線性模型一樣,穩健標準誤在IRF估計中往往很重要。穩健標準誤和 Newey-West 標準誤是可用的。
      IRFS 的局部投影提供了基于向量自回歸(VAR)模型的 IRFS 的替代方案。局部投影不受模型約束;因此,它們提供了更靈活的 IRF 系數。局部投影也允許更容易的假設檢驗。
      任何研究時間序列數據的人,包括經濟學、政治學、金融學和公共政策的研究人員對此功能都會感興趣。


    • 17. ARIMA and ARFIMA model selection (ARIMA 和 ARFIMA 模型選擇)


      想為您的數據找到最好的ARIMA或ARFIMA模型嗎?使用AIC、BIC和HQIC比較潛在模型。使用新的arimasoc和arfimasoc命令來選擇自回歸和移動平均項的最佳數量。
      使用自回歸移動平均(ARMA)模型的研究人員必須決定在其模型中包括自回歸和移動平均參數的適當滯后數。平衡模型擬合與模型簡約性的信息準則通常指導最大滯后數的選擇。
      arimasoc和arfimasoc通過擬合自回歸積分移動平均值(ARIMA)或自回歸分數積分移動平均數(ARFIMA)模型的集合并計算每個模型的信息標準來幫助模型選擇。arimasoc和arfimasoc計算Akaike信息準則(AIC)、貝葉斯信息準則(BIC)和Hannan–Quinn信息準則(HQIC)。所選擇的模型是信息標準值最低的模型。
      o ARIMA 和 ARFIMA 模型的模型選擇
      o AIC、BIC 和 HQIC 信息標準


    • 18. Flexible demand system models (靈活的需求系統模型) 點擊查看相關視頻


      通常情況下,研究人員對估計一籃子商品的需求感興趣。新的 demandys 命令提供了廣泛的工具來計算需求,并通過計算相應的彈性來衡量商品需求對價格和支出變化的敏感程度。 我們可以用 demandys 來擬合八個不同的需求系統模型:
      o Cobb–Douglas
      o Linear expenditure system
      o Basic translog
      o Generalized translog
      o Almost ideal demand
      o Generalized almost ideal
      o Quadratic almost ideal
      o Generalized quadratic almost ideal
      使用 estat 彈性命令,我們可以估計各種彈性支出彈性、未補償的自有價格和交叉價格彈性以及補償的自有物價和交叉價格的彈性,以探索需求對價格和支出變化的敏感程度。 由于有八種需求系統可供選擇,demandys 命令為研究人員提供了很大的靈活性,可以選擇符合其經驗假設的需求系統技術。


    • 19. IV quantile regression (IV分位數回歸) 點擊查看相關視頻


      當我們想研究協變量對結果的不同量級的影響,而不僅僅是對精益的影響時,我們使用分位數回歸。例如,我們可能對建立學生的年級分布模型感興趣,以及它如何受到協變量變化的影響?,F有的 qreg 命令適合于分位數回歸模型,但是如果我們懷疑其中一個協變量是內生的呢?這種內生性可能是由于研究參與者的自我選擇、模型中遺漏相關變量或測量誤差等原因造成的。新的 ivqregress 命令允許我們對結果的分位數進行建模,同時用 IV 控制由內生性引起的問題。擬合 IV 分位數回歸模型后,你可以用 estat coefplot 命令繪制各分位數指標的系數。你可以用 estat endogeffects 命令來檢驗內生性。還可以用 estat dualci 命令估計對弱工具具有穩健的雙重置信區間。
      分位數回歸在所有學科中都很流行,經濟學、公共政策、政治學、公共衛生和管理學的研究人員都會特別感興趣。


    • 20. IV fractional probit model (IV fractional probit 模型)


      分數結果很常見,你可能會對 401(K)養老金工廠的參與率、標準化考試的通過率、支出份額等進行建模。分數響應模型是一種靈活直觀的方法,可以對介于 0 和 1 之間的結果進行建模。它們不存在將產生 0 和 1 之外的預測的線性模型的問題,也不存在在 0 和 1 處未定義的 log-odds 模型的問題。分數響應模型可以使用現有的 fracreg 命令進行擬合。
      如果你擔心你的一個或多個模型協變量是內生的,該怎么辦?使用新的 ivfprobit 命令,您可以擬合分數因變量的模型,并考慮一個或多個協變量的內生性。


    • 21.Data Editor enhancements (數據編輯器的改進) 點擊查看相關視頻


      數據編輯器在 Stata 18 中有許多增強功能:
      可固定的行和列。固定的行或列不會與其他數據一起滾動,因此當您滾動數據時,它們將保持在視圖中。這對于與其他可能僅在滾動時可見的數據進行視覺比較非常有用。ID 變量是一個很自然的固定對象。
      字符串數據的可調整大小的單元格編輯器。編輯字符串變量時,可以調整單元格編輯器的大小,以便在編輯時可以看到更多的字符串,而不會從單元格編輯器的視圖中滾動出來。
      截斷文本的工具提示。任何單元格值如果太寬而無法適應其單元格列寬,則會截斷以適應。將鼠標指針懸停在具有截斷文本的單元格上,將顯示一個工具提示,其中包含該單元格的值而不截斷。
      比例寬度字體支持。數據編輯器現在支持等寬字體。這提高了數據的可讀性,并允許在不需要滾動的情況下一次顯示更多的變量。如果愿意,仍然可以使用單格字體。
      在列標題中顯示變量標簽。變量標簽現在可以顯示在列標題中變量名稱的正下方。這對于查看具有變量標簽的簡短和非描述性變量名的數據集非常有用。用于隱藏或顯示值標簽的新鍵盤快捷方式。在查看數值及其對應標簽之間快速切換。


    • 22.Do-file Editor enhancements (Do 文件編輯器的改進)

      Do文件編輯器在 Stata 18 中也有增強功能:
      自動備份。在 Do 文件編輯器中打開的文檔會定期保存到磁盤上的備份文件中。其中包括尚未保存到磁盤的新文檔。如果您的計算機在您有機會保存對文檔的更改之前斷電或崩潰,您未保存的更改仍然可以恢復。若要恢復未保存的更改,請在 Do 文件編輯器中再次打開文檔。如果在與文檔相同的位置找到備份文件,系統將提示您恢復備份文件或打開上次保存到磁盤的文檔?;謴蛡浞菸募恍鑼⑵浼虞d到 Do 文件編輯器中;除非您選擇這樣做,否則它不會重寫保存到磁盤的文檔。
      語法高亮顯示用戶定義的關鍵字。Statas Do 文件編輯器現在包括語法高亮顯示用戶定義的關鍵字的功能。這將允許您在語法上突出顯示您最喜歡的社區貢獻的命令。您只需創建一個特殊命名的關鍵字定義文件,其中包含關鍵字列表,Stata 將使用可設置的顏色和字體樣式(如粗體或斜體)在語法上突出顯示這些關鍵字。您甚至可以創建一個全局關鍵字定義文件,該文件可以與同一臺計算機的所有用戶共享。每個用戶仍然可以創建自己的本地關鍵字定義文件,全局文件和本地文件中的關鍵字都將加載到Do文件編輯器中。


    • 23 .Corrected and consistent AIC (更正一致性AIC)

      使用一致的 AIC (CAIC) 比較模型?;蛘?,對于小樣本量,使用校正后的 AIC (AICc)。


    • 24 .New spline functions (新的樣條函數)

      改進后的樣條生成工具——新的makespline——支持 B 樣條并一次為多個變量生成樣條。


    • 25 .Vectorized numerical integration (矢量數值積分)

      同時逼近多個數值積分。自適應 Gauss–Kronrod 和 Simpson 方法。對奇異點的魯棒性。


    • 26 .Boost-based regular expressions (基于 Boost 的正則表達式)

      新的基于 Boost 的正則表達式函數
      允許不同的正則表達式語法
      正則表達式是處理字符串數據的強大工具。Stata 的正則表達式在 Stata 18 中變得更加強大,具有更多功能。


    • 27 .New reporting features (新報表功能)

      可重現的報告使我們能夠在分析發生變化時簡化呈現我們的發現的過程。無論我們的工作方向發生變化還是我們實施同行的反饋,用我們的研究結果創建一份報告很少是一次性的任務。Stata 的可重現報告功能使我們能夠隨著分析的變化輕松修改和調整我們的報告。
      在 Stata 18 中,我們為 putdocx 和 putexcel 添加了功能,允許您進一步自定義可重現的報告?,F在您可以使用putexcel添加頁眉、頁腳和分頁符。您還可以凍結工作表中的一行或一列;這使您可以在視圖中保留該行或列中的信息,同時滾動瀏覽工作表的其余部分。此外,您可以創建命名的單元格區域以簡化公式的使用。我們還使用 putdocx 添加了對書簽的支持; 只需將您的文本格式化為書簽,并根據需要鏈接到它。此外,在將圖像添加到 .docx 文件時,您現在可以為要由語音軟件讀取的圖像指定替代文本。
      putdocx中的新功能
      o 在段落和表格中包含書簽
      o 包括可供圖像語音軟件閱讀的替代文本
      o 包括可縮放矢量圖形 (.svg) 圖像
      putexcel中的新功能
      o 將工作表凍結在特定的行或列
      o 在特定行或列插入分頁符
      o 在工作表中插入頁眉和頁腳
      o 在單元格中包含超鏈接
      o 創建命名單元格區域


    • 28 .Graph colors by variable (按變量劃分的圖表顏色)

      想要散點圖中點的顏色來反映年齡組嗎?或者想要條形圖中條形的顏色反映收入水平?或者想要點圖中點的顏色來反映健康狀況?
      在 Stata 18 中,新的colorvar()選項允許許多雙向圖根據變量的值改變標記、條形等的顏色。
      o 使用標記顏色來傳達可變信息
      o 連續或離散地改變顏色
      o 指定顏色應如何鏈接到顏色變量的值
      o 適用于許多雙向圖,包括散點圖和條形圖


    • 29 .Frame sets (框架組)

      您在內存中使用多個數據集,也稱為幀。當這些數據集相關時——也許它們在同一個項目中使用或相互鏈接——你現在可以將它們捆綁在一個框架集中。將所有數據集保存在一個文件中。以后一起使用它們。

    • more






    快!精準!易于使用! Stata是一個完整的集成軟件包,可提供您的所有數據科學需求 - 數據處理,可視化,統計和自動報告。


    掌握您的數據
    廣泛的統計功能
    出版質量的圖形
    自動報告
    真正可重復的研究
    PyStata — Python 集成
    真實文檔
    值得信賴
    簡單易用
    易于掌握
    易于自動化
    易于擴展
    高級編程
    自動多核支持
    跨平臺兼容
    世界一流的技術支持



    • 掌握您的數據

      Stata的數據管理功能如下:
      同時管理多個數據集
      Import, export
      JDBC, ODBC, SQL
      排序,匹配,合并,加入,追加,創建
      內置電子表格
      unicode
      處理文本或二進制數據
      在本地或在Web上訪問數據
      收集組間的統計信息
      BLOBs -strings可以容納整個文檔
      數十億個觀測值
      數萬個變量數
      生存數據, 面板數據, 多級數據, 調查數據, 多重插補數據, 分類數據, 時間序列數據
      更重要的是,支持您的所有數據科學需求。

    • 廣泛的統計功能

    • 出版品質的圖形


      Stata可以輕松生成出版品質,風格獨特的圖形。

      您可以指向并單擊以創建自定義圖形?;蛘?,您可以編寫腳本以可重現的方式生成數百或數千個圖形。將圖形導出為EPS或TIFF進行發布,導出為PNG或SVG進行Web導出,或者導出為PDF進行查看。使用集成的Graph Editor,您可以單擊以更改有關圖形的任何內容或添加標題,注釋,線條,箭頭和文本。

    • 自動報告

      自動報告結果所需的所有工具 。

      動態Markdown文檔
      創建Word文檔
      創建PDF文檔
      創建Excel文件
      可定制的表格
      圖形方案
      Word,HTML,PDF,SVG,PNG




    • 真正可重復的研究

      很多人談論可重復的研究。
      Stata 已經致力于它超過30年。
      我們不斷添加新功能; 我們甚至從根本上改變了語言元素。不管。Stata 是唯一具有集成版本控制的統計軟件包。如果你在1985年編寫了一個腳本來執行分析,那么同樣的腳本仍然可以運行,并且今天仍會產生相同的結果。您在1985年創建的任何數據集,今天都可以閱讀。在2050年也是如此.Stata 將能夠運行你今天所做的任何事情。

    • PyStata — Python集成

      以交互方式調用Python或將Python嵌入到您的Stata代碼中。
      從Python調用Stata并從IPython環境調用Stata代碼。
      在Jupyter Notebook中使用Stata。
      在Stata和Python之間無縫傳遞數據和結果。
      從Python內部使用Stata分析。

      在Stata中使用任何Python包
      Matplotlib和Seaborn進行可視化
      美麗的湯和Scrapy用于網頁抓取
      NumPy和熊貓進行數值分析
      TensorFlow和scikit-learn用于機器學習
      以及更多

    • 真實的文檔

      我們的每個數據管理功能都經過充分解釋和記錄,并在實際示例中顯示。每個估算器都有完整的文檔記錄,包括幾個關于實際數據的示例,以及如何解釋結果的真實討論。這些示例為您提供數據,以便您可以在 Stata 中工作甚至擴展分析。我們為您提供每個功能的快速入門,展示一些最常見的用途。想要更多細節?我們的方法和公式部分提供了計算內容的具體信息,我們的參考文獻為您提供了更多信息。 Stata 是一個很大的包,所以有很多文檔 - 超過17,000頁,共33卷。但不要擔心,鍵入 help ,Stata 將搜索其關鍵字,索引,甚至社區提供的包,為您帶來您需要了解的主題。一切都在Stata內可用。

    • 值得信賴

      我們不僅編程統計方法,還對它們進行驗證。
      您從 Stata 估算器看到的結果取決于與其他估算器的比較,一致性和覆蓋率的蒙特卡洛模擬以及我們的統計人員進行的廣泛測試。我們運送的每一個Stata都通過了一套認證套件 ,其中包括370萬行測試代碼,可產生560萬行輸出。我們對560萬行輸出中的每個數字和一段文本進行認證。

    • 簡單易用

      Stata 的所有功能都可以通過 菜單,對話框,控制面板,數據編輯器,變量管理器,圖形編輯器甚至 SEM 圖形生成器來訪問。您可以通過任何分析指向并單擊您的方式。
      如果您不想編寫命令和腳本,則不必這樣做。
      即使您指向并單擊,也可以記錄所有結果,然后將其包含在報告中。您甚至可以保存您的操作創建的命令,并在以后重現您的完整分析。

    • 容易掌握

      Stata 執行任務的命令直觀易學。更好的是,您從執行任務中學到的所有知識都可以應用于其他任務。例如,您只需在任何命令中添加“ gender =“ =” female“,即可將分析范圍限制為樣本中的女性。您只需將 vce(robust)添加到任何估計量中,即可獲得對許多常見假設都具有魯棒性的標準誤差和假設檢驗。
      一致性更加深入。您從數據管理命令中學到的知識通常適用于估算命令,反之亦然。還有一整套后估計命令,用于執行假設檢驗,形成線性和非線性組合,進行預測,形成對比,甚至使用交互作用圖執行邊際分析。在幾乎每個估算器之后,這些命令都以相同的方式工作。
      排序命令以讀取和清除數據,然后執行統計測試和估計,最后報告結果是可重復研究的核心。Stata 使所有研究人員都可以訪問此過程。

    • 易于自動化

      每個人都有他們一直在做的任務 - 創建特定類型的變量,生成特定的表,執行一系列統計步驟,計算 RMSE 等??赡苄允菬o窮無盡的。Stata 有數千個內置程序,但可能擁有相對獨特的任務或者您希望以特定方式完成的任務。
      如果您編寫了一個腳本來執行給定數據集上的任務,則可以輕松地將該腳本轉換為可用于所有數據集,任何變量集以及任何觀察集的內容。

    • 易于擴展

      自動化的一些內容可能非常實用。只需一點代碼,就可以將自動化腳本轉換為 Stata 命令。支持 Stata 官方命令支持的標準功能的命令??梢耘c使用官方命令相同的方式使用的命令。

    • 高級編程

      Stata 還包括一種高級編程語言-Mata。
      Mata 具有您期望在編程語言中使用的結構,指針和類,并為矩陣編程添加了直接支持。
      Mata 既是一個用于操作矩陣的交互式環境,也是一個可以生成編譯和優化代碼的完整開發環境。它包括處理面板數據的特殊功能,對實際或復雜矩陣執行操作,為面向對象編程提供全面支持,并與 Stata 的各個方面完全集成。

    • 充分利用您的多核計算機。
      沒有其他統計軟件可以與之匹敵。
      以最快的速度享受 Stata 18 的新功能。

    • 跨平臺兼容

      Stata 將在 Windows,Mac 和 Linux / Unix 計算機上運行;但是,我們的許可證不是特定于平臺的。
      這意味著,如果您有一臺 Mac 筆記本電腦和 Windows 臺式機,則不需要兩個單獨的許可證即可運行Stata。您可以在任何受支持的平臺上安裝 Stata 許可證。Stata 數據集,程序和其他數據可以在不進行翻譯的情況下跨平臺共享。您還可以快速輕松地從其他統計數據包,電子表格和數據庫中導入數據集。



    Stata各系列版本區別


     Stata/MP, Stata/SE, Stata/BE 三個版本
     Stata/MP : 最快的 Stata 版本(四核,雙核和多核/多處理器計算機),可以分析最大的數據集。
     Stata/SE   : 標準版; 對于更大的數據集。
     Stata/BE   : 基礎版; 用于中型數據集。


    Stata/SE 和 Stata/BE 的區別僅在于每個數據集可以分析的數據集大小不同。與 Stata/BE(最多798個)相比,Stata/SE(最多10,998個)和 Stata/MP(最多65,532個)可以擬合具有更多自變量的模型。Stata/SE 最多可以分析20億個觀測值。
    Stata/BE 允許具有多達2,048個變量和20億個觀測值的數據集。一個模型中的 Stata/BE 最多可包含798個獨立變量。



    Stata/MP 性能報告


    Stata/MP 是最快,最大的 Stata 版本。實際上,當前任何一臺計算機都可以利用 Stata/MP 的高級多處理功能。這包括Intel i3, i5, i7, i9, Xeon, Celeron, and AMD multi-core chips。在雙核芯片上,根據耗時的估算命令,Stata/MP的總體運行速度提高40%,在重要的位置運行速度提高72%。Stata / MP具有兩個以上的內核或處理器,速度甚至更快。

    Stata MP,Stata/SE和Stata/BE均可在任何計算機上運行,??但Stata/MP的運行速度更快。您可以購買Stata/MP許可證,最多可獲取計算機上的內核數量(最多64個)。例如,如果您的計算機具有八個核心,則可以為八個核心,四個核心或兩個核心購買Stata/MP許可證。


    Stata/MP還可以分析比其他任何版本的Stata更多的數據。如果使用當前最大的計算機,Stata/MP可以分析100到200億個觀測值,并且一旦計算機硬件趕上來,就可以分析多達1萬億個觀測值。


    在執行計算密集型估計程序時,速度通常是最關鍵的。包括線性回歸在內的一些 Stata 估計程序幾乎是完全并行的,這意味著它們在兩個內核上的運行速度是原來的兩倍,在四個內核上的運行速度是原來的四倍,在八個內核上的運行速度是其八倍,等等。一些估計命令可以比其他命令更多地并行化。以中位數計算,估計命令在 2 核上的運行速度快 1.8 倍,在 4 核上快 2.9 倍,在 8 核上快 4.1 倍。


    在管理大型數據集時,速度也很重要。添加新變量幾乎可實現 100% 并行計算,而排序時的并行計算可到達 61% 。



    Stata版本功能對比

    Product features
    (Basic Edition) (Standard Edition)
    2-core 4-core 6+
    Maximum number of variables
    變量的最大數量
    Up to 2,048 variables Up to 32,767 variables Up to 120,000 variables
    Maximum number of observations
    最大觀測次數
    2.14 billion 2.14 billion Up to 20 billion
    Speed comparisons
    速度比較
    Fast Fast
    Twice as fast Almost four times as fast Even faster
    Time to run logistic regression with 10 million observations and 20 covariates
    使用1000萬個觀測值和20個協變量進行邏輯回歸的時間
    20 seconds 20 seconds
    10 seconds 5.2 seconds < 5.2 seconds
    Maximum number of independent variables
    自變量的最大數量
    798 10,998 65,532
    Complete suite of statistical features
    完整的統計特征套件
    Yes! Yes!
    Yes! Yes! Yes!
    Publication-quality graphics
    出版物質量圖形
    Yes! Yes!
    Yes! Yes! Yes!
    Extensive data management facilities
    廣泛的數據管理設施
    Yes! Yes!
    Yes! Yes! Yes!
    Truly reproducible research
    真正可重復的研究
    Yes! Yes!
    Yes! Yes! Yes!
    Comprehensive reporting and table generation
    全面的報告和表格生成
    Yes! Yes!
    Yes! Yes! Yes!
    Powerful programming language
    強大的編程語言
    Yes! Yes!
    Yes! Yes! Yes!
    Complete PDF documentation
    完整的PDF文檔
    Yes! Yes!
    Yes! Yes! Yes!
    Exceptional technical support
    卓越的技術支持
    Yes! Yes!
    Yes! Yes! Yes!
    Includes within-release updates
    包含在版本更新中
    Yes! Yes!
    Yes! Yes! Yes!
    Windows, macOS, and Linux
    Yes! Yes!
    Yes! Yes! Yes!
    And much more for all your data science needs
    更多滿足您所有數據科學需求
    Yes! Yes!
    Yes! Yes! Yes!
    Memory requirements
    內存要求
    1 GB 2 GB
    4 GB
    Disk space requirements
    磁盤空間要求
    2 GB 2 GB
    2 GB

    點擊列表鏈接查看視頻功能演示

    Lasso|套索估計量
    Reproducible reporting|研究報告的可重復性
    Meta-Analysis|元分析
    Choice Models|選擇模型
    Python Integration|Python集成
    Bayes—multiple chains, more|貝葉斯分析新功能
    Panel-data ERMs|面板數據ERM
    Import Data from SAS and SPSS |從SAS和SPSS導入數據
    Nonparametric series regression |非參數序列回歸
    Frames — multiple datasets in memory|幀-內存中的多個數據集
    Panel-data mixed logit | 面板數據
    Nonlinear DSGE models|非線性 DSGE 模型
    Multiple-group IRT | 多組IRT
    xtheckman|xtheckman新命令
    NLMEMs with lags: PK models | PK模型
    Heteroskedastic ordered probit | 異方差有序概率
    Point sizes for graphics | 圖形
    Numerical integration
    Linear programming | 線性回歸
    Mac interface | Mac介面
    Do-file Editor autocompletion |do 文件編輯器
    Sample-size analysis for CIs

    功能列表

    功能名稱 功能介紹
    線性模型
    (Linear models)
    regression   ?   censored outcomes   ?   endogenous regressors   ?   bootstrap, jackknife, and robust and cluster–robust variance   ?   instrumental variables   ?   three-stage least squares   ?   constraints   ?   quantile regression   ?   GLS   ?   DID   ?   more
    面板/縱向數據
    (Panel/longitudinal data)
    random and fixed effects with robust standard errors   ?   linear mixed models   ?   random-effects probit   ?   GEE   ?   random- and fixed-effects Poisson   ?   dynamic panel-data models   ?   instrumental variables   ?   DID   ?   panel unit-root tests   ?   more
    多級混合效應模型
    (Multilevel mixed-effects models)
    continuous, binary, count, and survival outcomes   ?   two-, three-, and higher-level models   ?   generalized linear models   ?   nonlinear models   ?   random intercepts   ?   random slopes   ?   crossed random effects   ?   BLUPs of effects and fitted values   ?   hierarchical models   ?   residual error structures   ?   DDF adjustments   ?   support for survey data   ?   more
    二進制、計數和有限結果
    (Binary, count, and limited outcomes)
    logistic, probit, tobit   ?   Poisson and negative binomial   ?   conditional, multinomial, nested, ordered, rank-ordered, and stereotype logistic   ?   multinomial probit   ?   zero-inflated and left-truncated models   ?   selection models   ?   marginal effects   ?   more
    選擇模型
    (Choice models)
    discrete choice   ?   rank-ordered alternatives   ?   conditional logit   ?   multinomial probit   ?   nested logit   ?   mixed logit   ?   panel data   ?   case-specific and alternative-specific predictors   ?   interpret results—expected probabilities, covariate effects, comparisons across alternatives   ?   more
    擴展回歸模型(ERMs)
    (Extended regression models (ERMs))
    endogenous covariates   ?   sample selection   ?   nonrandom treatment   ?   panel data   ?   account for problems alone or in combination   ?   continuous, interval-censored, binary, and ordinal outcomes   ?   more
    廣義線性模型(GLMs)
    (Generalized linear models (GLMs))
    ten link functions   ?   user-defined links   ?   seven distributions   ?   ML and IRLS estimation   ?   nine variance estimators   ?   seven residuals   ?   more
    有限混合模型(FMMs)
    (Finite mixture models (FMMs))
    fmm: prefix for 17 estimators   ?   mixtures of a single estimator   ?   mixtures combining multiple estimators or distributions   ?   continuous, binary, count, ordinal, categorical, censored, truncated, and survival outcomes   ?   more
    空間自回歸模型
    (Spatial autoregressive models)
    spatial lags of dependent variable, independent variables, and autoregressive errors   ?   fixed and random effects in panel data   ?   endogenous covariates   ?   analyze spillover effects   ?   more
    方差分析/多變量方差分析
    (ANOVA/MANOVA)
    balanced and unbalanced designs   ?   factorial, nested, and mixed designs   ?   repeated measures   ?   marginal means   ?   contrasts   ?   more
    精確統計
    (Exact statistics)
    standardization of rates   ?   case–control   ?   cohort   ?   matched case–control   ?   Mantel–Haenszel   ?   pharmacokinetics   ?   ROC analysis   ?   ICD-10   ?   more
    流行病學
    (Epidemiology)
    standardization of rates   ?   case–control   ?   cohort   ?   matched case–control   ?   Mantel–Haenszel   ?   pharmacokinetics   ?   ROC analysis   ?   ICD-10   ?   more
    動態隨機一般均衡模型
    (DSGE models)
    specify models algebraically   ?   solve models   ?   estimate parameters   ?   identification diagnostics   ?   policy and transition matrices   ?   IRFs   ?   dynamic forecasts   ?   Bayesian   ?   more
    測試、預測和結果
    (Tests, predictions, and effects)
    Wald tests   ?   LR tests   ?   linear and nonlinear combinations   ?   predictions and generalized predictions   ?   marginal means   ?   least-squares means   ?   adjusted means   ?   marginal and partial effects   ?   forecast models   ?   Hausman tests   ?   more
    差異、成對比較和差數
    (Contrasts, pairwise comparisons, and margins)
    compare means, intercepts, or slopes   ?   compare with reference category, adjacent category, grand mean, etc.   ?   orthogonal polynomials   ?   multiple-comparison adjustments   ?   graph estimated means and contrasts   ?   interaction plots   ?   more
    再抽樣及模擬方法
    (Resampling and simulation methods)
    bootstrap   ?   jackknife   ?   Monte Carlo simulation   ?   permutation tests   ?   exact p-values   ?   more
    多變量方法
    (Multivariate methods)
    factor analysis   ?   principal components   ?   discriminant analysis   ?   rotation   ?   multidimensional scaling   ?   Procrustean analysis   ?   correspondence analysis   ?   biplots   ?   dendrograms   ?   user-extensible analyses   ?   more
    時間序列
    (Time series)
    ARIMA   ?   ARFIMA   ?   ARCH/GARCH   ?   VAR   ?   VECM   ?   multivariate GARCH   ?   unobserved-components model   ?   dynamic factors   ?   state-space models   ?   Markov-switching models   ?   business calendars   ?   tests for structural breaks   ?   threshold regression   ?   forecasts   ?   impulse–response functions   ?   unit-root tests   ?   filters and smoothers   ?   rolling and recursive estimation   ?   Bayesian   ?   more
    生存分析
    (Survival analysis)
    Kaplan–Meier and Nelson–Aalen estimators,   ?   Cox regression (frailty)   ?   parametric models (frailty, random effects)   ?   competing risks   ?   hazards   ?   time-varying covariates   ?   left-, right-, and interval-censoring   ?   Weibull, exponential, and Gompertz models   ?   more
    貝葉斯分析
    (Bayesian analysis)
    thousands of built-in models   ?   univariate and multivariate models   ?   linear and nonlinear models   ?   panel data   ?   multilevel models   ?   VAR   ?   DSGE   ?   continuous, binary, ordinal, and count outcomes   ?   bayes: prefix for 58 estimation commands   ?   continuous univariate, multivariate, and discrete priors   ?   add your own models   ?   multiple chains   ?   convergence diagnostics   ?   posterior summaries   ?   hypothesis testing   ?   model fit   ?   model comparison   ?   predictions   ?   dynamic forecast   ?   impulse-response functions   ?   more
    元分析
    (Meta-analysis)
    effect sizes   ?   common, fixed, and random effects   ?   forest, funnel, and more plots   ?   subgroup, leave-one-out, and cumulative analysis   ?   meta-regression   ?   small-study effects   ?   publication bias   ?   multivariate   ?   more
    功效、精度和樣本大小
    (Power, precision, and sample size)
    power   ?   sample size   ?   effect size   ?   minimum detectable effect   ?   CI width   ?   means   ?   proportions   ?   variances   ?   correlations   ?   ANOVA   ?   regression   ?   cluster randomized designs   ?   case–control studies   ?   cohort studies   ?   contingency tables   ?   survival analysis   ?   balanced or unbalanced designs   ?   results in tables or graphs   ?   more
    治療效果/因果推斷
    (Treatment effects/Causal inference)
    inverse probability weight (IPW)   ?   doubly robust methods   ?   propensity-score matching   ?   regression adjustment   ?   covariate matching   ?   DID   ?   multilevel treatments   ?   endogenous treatments   ?   average treatment effects (ATEs)   ?   ATEs on the treated (ATETs)   ?   potential-outcome means (POMs)   ?   continuous, binary, count, fractional, and survival outcomes   ?   panel data   ?   lasso   ?   more
    Lasso回歸模型
    (Lasso)
    lasso   ?   elastic net   ?   model selection   ?   prediction   ?   inference   ?   continuous, binary, and count outcomes   ?   cross-validation   ?   adaptive lasso   ?   double selection   ?   partialing out   ?   cross-fit partialing out   ?   double machine learning   ?   endogenous covariates   ?   treatment effects   ?   more
    結構方程模型(SEM)
    (SEM (structural equation modeling))
    graphical path diagram builder   ?   standardized and unstandardized estimates   ?   modification indices   ?   direct and indirect effects   ?   continuous, binary, count, ordinal, and survival outcomes   ?   multilevel models   ?   random slopes and intercepts   ?   factor scores, empirical Bayes, and other predictions   ?   groups and tests of invariance   ?   goodness of fit   ?   handles MAR data by FIML   ?   correlated data   ?   survey data   ?   more
    潛伏組分析
    (Latent class analysis)
    binary, ordinal, continuous, count, categorical, fractional, and survival items   ?   add covariates to model class membership   ?   combine with SEM path models   ?   expected class proportions   ?   goodness of fit   ?   predictions of class membership   ?   more
    多重估算
    (Multiple imputation)
    nine univariate imputation methods   ?   multivariate normal imputation   ?   chained equations   ?   explore pattern of missingness   ?   manage imputed datasets   ?   fit model and pool results   ?   transform parameters   ?   joint tests of parameter estimates   ?   predictions   ?   more
    調查方法
    (Survey methods)
    multistage designs   ?   bootstrap, BRR, jackknife, linearized, and SDR variance estimation   ?   poststratification   ?   raking   ?   calibration   ?   DEFF   ?   predictive margins   ?   means, proportions, ratios, totals   ?   summary tables   ?   almost all estimators supported   ?   more
    聚類分析
    (Cluster analysis)
    hierarchical clustering   ?   kmeans and kmedian nonhierarchical clustering   ?   dendrograms   ?   stopping rules   ?   user-extensible analyses   ?   more
    項目反應理論(IRT)
    (IRT (item response theory))
    binary (1PL, 2PL, 3PL), ordinal, and categorical response models   ?   item characteristic curves   ?   test characteristic curves   ?   item information functions   ?   test information functions   ?   multiple-group models   ?   differential item functioning (DIF)   ?   more
    網絡分析
    (Network analysis)
    nwcommands: import and manipulate networks   ?   generate networks   ?   calculate centrality and dissimilarity measures   ?   visualize networks   ?   more
    數據[資料]管理
    (Data manipulation)
    data transformations   ?   data frames   ?   match-merge   ?   import/export data   ?   JDBC   ?   ODBC   ?   SQL   ?   Unicode   ?   by-group processing   ?   append files   ?   sort   ?   row–column transposition   ?   labeling   ?   save results   ?   more
    報表
    (Reporting)
    reproducible reports   ?   customizable tables   ?   graphical tables builder   ?   Word   ?   Excel   ?   PDF   ?   HTML   ?   dynamic documents   ?   Markdown   ?   Stata results and graphs   ?   SVG   ?   EPS   ?   PNG   ?   TIF   ?   more
    繪圖
    (Graphics)
    lines   ?   bars   ?   areas   ?   ranges   ?   contours   ?   confidence intervals   ?   interaction plots   ?   survival plots   ?   publication quality   ?   customize anything   ?   Graph Editor   ?   more
    編程特點
    (Programming features)
    adding new commands   ?   scripting   ?   object-oriented programming   ?   menu and dialog-box programming   ?   dynamic documents   ?   Markdown   ?   Project Manager   ?   Python integration   ?   PyStata   ?   Jupyter notebook   ?   Java integration   ?   Java plugins   ?   H2O access   ?   C/C++ plugins   ?   more
    矩陣編程 Mata—Stata重要編程語言
    (Mata—Stata's serious programming language)
    interactive sessions   ?   large-scale development projects   ?   optimization   ?   matrix inversions   ?   decompositions   ?   eigenvalues and eigenvectors   ?   LAPACK engine   ?   Intel? MKL   ?   real and complex numbers   ?   string matrices   ?   interface to Stata datasets and matrices   ?   numerical derivatives   ?   object-oriented programming   ?   more
    圖形用戶界面
    (Graphical user interface)
    menus and dialogs for all features   ?   Data Editor   ?   Variables Manager   ?   Graph Editor   ?   Project Manager   ?   Do-file Editor   ?   multiple preference sets   ?   more
    參考資料
    (Documentation)
    35 manuals ? 18,000+ pages ? seamless navigation ? thousands of worked examples ? quick starts ? methods and formulas ? references ? more
    基本統計
    (Basic statistics)
    summaries   ?   cross-tabulations   ?   correlations   ?   z and t tests   ?   equality-of-variance tests   ?   tests of proportions   ?   confidence intervals   ?   factor variables   ?   more
    非參數方法
    (Nonparametric methods)
    nonparametric regression   ?   Wilcoxon–Mann–Whitney, Wilcoxon signed ranks, and Kruskal–Wallis tests   ?   Cochran–Armitage and other trend tests   ?   Spearman and Kendall correlations   ?   Kolmogorov–Smirnov tests   ?   exact binomial CIs   ?   survival data   ?   ROC analysis   ?   smoothing   ?   bootstrapping   ?   more
    GMM與非線性回歸
    (GMM and nonlinear regression)
    generalized method of moments (GMM)   ?   nonlinear regression   ?   more
    簡單最大概似法
    (Simple maximum likelihood)
    specify likelihood using simple expressions   ?   no programming required   ?   survey data   ?   standard, robust, bootstrap, and jackknife SEs   ?   matrix estimators   ?   more
    可編程最大概似法
    (Programmable maximum likelihood)
    user-specified functions   ?   NR, DFP, BFGS, BHHH   ?   OIM, OPG, robust, bootstrap, and jackknife SEs   ?   Wald tests   ?   survey data   ?   numeric or analytic derivatives   ?   more
    其他統計方法
    (Other statistical methods)
    kappa measure of interrater agreement   ?   Cronbach's alpha   ?   stepwise regression   ?   tests of normality   ?   more
    函數
    (Functions)
    statistical   ?   random-number   ?   mathematical   ?   string   ?   date and time   ?   regular expressions   ?   Unicode   ?   more
    互聯網功能
    (Internet capabilities)
    search and download thousands of community-contributed features (see below)   ?   web updating   ?   web file sharing   ?   latest Stata news   ?   more
    網絡社區功能
    (Community-contributed features)
    search and download thousands of free additions   ?   discover new features in the Stata Journal   ?   share commands by posting to the SSC   ?   discuss community-contributed features on Statalist   ?   more
    嵌入式統計計算
    (Embedded statistical computations)
    Numerics by Stata   ?   more
    安裝驗證
    (Installation Qualification)
    IQ report for regulatory agencies such as the FDA   ?   installation verification   ?   more
    FDA規則
    (FDA Compliance)
    Adherence to FDA regulatory requirement for statistical software   ?   more
    無障礙訪問
    (Accessibility)
    Section 508 compliance, accessibility for persons with disabilities   ?   more
    樣本范例
    (Sample session)
    A sample session of Stata for Mac, Unix, or Windows.

    更多功能特色

    • 1. 表格 (Tables)



      用戶一直希望我們提供更完美的表格,現在您可以很容易地創建比較回歸結果或匯總統計數據的表格,您可以創建樣式并將其應用于您構建的任何表,還可以將表導出到MS Word?, PDF, HTML, LaTeX, MS Excel?, 并將它們插入到報告中。新版本修改了table命令,新的 collective 前綴可以從任意多個命令收集任意多的結果,生成表格,并將其導出為多種格式等。您還可以使用新的Tables Builder來單擊并創建表格。


    • 2. 貝葉斯計量經濟學



      Stata能進行計量經濟學,也能進行貝葉斯統計,現在Stata能夠進行貝葉斯計量經濟學!想要用概率性的陳述來回答經濟問題,例如:那些參加職業培訓項目的人在未來五年里更有可能保持就業嗎?想把對經濟過程的先驗知識結合起來嗎?Stata新推出的貝葉斯計量經濟學功能可以幫到您。適合許多貝葉斯模型,如橫截面模型、面板數據模型、多層模型和時間序列模型。使用貝葉斯因子比較模型,獲取更多預測和展望!

      在計量經濟學建模中使用貝葉斯方法的吸引力之一是將關于通常在實踐中可用的模型參數的外部信息納入其中。這些信息可能來自歷史數據,也可能自然來自經濟過程的知識。無論哪種方式,貝葉斯方法都可以使我們將外部信息與我們在當前數據中觀察到的信息結合起來,以形成對感興趣的經濟過程的更現實的看法。

      Stata 17 在貝葉斯計量經濟學領域提供了幾個新功能:
      > Bayesian VAR models /貝葉斯VAR模型
      > Bayesian IRF and FEVD analysis /貝葉斯IRF和FEVD分析
      > Bayesian dynamic forecasting /貝葉斯動態預測
      > Bayesian longitudinal/panel-data models /貝葉斯縱向/面板數據模型
      > Bayesian linear and nonlinear DSGE models /貝葉斯線性與非線性DSGE模型



    • 3. 更快的Stata



      Stata不僅重視數據處理的準確性而且重視處理的速度,兩者之間通常需要權衡取舍,但Stata努力為用戶提供兩全其美的選擇。在Stata 17中,我們更新了sort和collapse的算法,使這些命令運行更快。我們還對某些估計命令(例如mixed)實現了速度改進,使這些命令適合多層混合效應模型(multilevel mixed-effects models)。


    • 4. 雙重差分(DID)和DDD模型



      新的估計命令didregress和xtdidregress具有使用重復測量數據擬合雙重差分(DID)模型和三重差分(DDD)模型。 didregress適用于重復橫截面數據,xtdidregress適用于縱向/面板數據。
      采用DID和DDD模型,用重復測量數據估計平均治療效果(ATET)。 治療效果可以是藥物方案對血壓的影響,也可以是培訓計劃對就業的影響。 與現有的teffects命令可用的標準橫截面分析不同,DID分析可控制估計ATET時的組和時間效應,組可在其中識別重復的度量。DDD分析控件可控制其他組效果及其與時間的相互作用——您最多可以指定三個組變量或兩個組變量和一個時間變量。


    • 5. 區間刪失Cox模型


      半參數Cox比例風險回歸模型通常用于分析未刪失和右刪失的事件時間數據。 新的估計命令stintcox可使用Cox模型,來估計刪失事件時間數據。當未直接觀察到發生某個事件(例如癌癥復發)的時間,但已知該時間間隔在某個時間間隔內時,便會進行時間間隔檢查。例如,可以在定期檢查之間檢測到癌癥的復發,但是無法觀察到確切的復發時間。我們只知道在先前檢查和當前檢查之間的某個時間復發了癌癥。忽略區間刪失可能會導致錯誤的結果(有偏差的)。
      當沒有完全指定基線風險函數時,對區間刪失事件時間數據進行半參數估計是一項挑戰,因為沒有一個事件時間是被精確地觀測到的。
      因此,這些數據的“半參數”建模通常采用樣條方法或分段指數模型作為基線風險函數。直到最近的方法學進展(在stintcox命令中實現)之后,才提供真正的區間刪失事件時間數據的半參數建模。


    • 6. 多維元分析



      您想分析多項研究的結果。這些研究報告了多個效應量,這些效應量很可能在一項研究中相互關聯。單獨的meta分析(例如使用現有meta命令的那些meta分析)將忽略相關性?,F在,您可以使用新的meta mvregress命令執行多維元分析,這將解釋相關性。


    • 7. 貝葉斯VAR模型



      貝葉斯前綴現在支持var命令以擬合貝葉斯矢量自回歸(VAR)模型。VAR模型通過將結果變量的滯后時間作為模型預測變量來研究多個時間序列之間的關系。已知這些模型具有許多參數:對于K個結果變量和標記,至少存在p(K ^ 2 + \ nn1)個參數。對模型參數的可靠估計可能會遇到挑戰,尤其是在使用小型數據集的情況下。貝葉斯VAR模型通過整合有關模型參數的先驗信息來穩定參數估計,從而克服了這些挑戰。


    • 8. PyStata



      Stata 17引入了一個我們稱之為PyStata的概念。PyStata是一個涵蓋了Stata和Python可以交互的所有方式的術語。
      Stata 16具有從Stata調用Python代碼的功能。Stata 17允許您通過一個新的pystata Python包從一個獨立的Python環境中調用Stata,從而極大地擴展了此功能。您可以在基于IPython內核的環境(例如Jupyter Notebook和控制臺以及Jupyter Lab和控制臺)中方便地訪問Stata和Mata。
      在其他支持IPython內核的環境中(例如,Spyder IDE和PyCharm IDE);或從命令行訪問Python(例如Windows命令提示符,macOS終端,Unix終端和Python的IDLE)時。


    • 9. Lasso治療效果評估



      您可以使用teffects 來估計治療效果。您可以使用Lasso來控制許多協變量。(當我們說“很多”時,可以理解為成百上千甚至更多?。┈F在,您可以使用telasso來估計治療效果并控制許多協變量。

    • 10. Galbraith圖



      新命令meta galbraithplot生成Galbraith圖以進行元分析。這些圖可用于評估研究的異質性和檢測潛在的異常值。當有許多研究時,它們還可以用作森林圖forest plots的替代方案,以總結元分析結果。

    • 11. 留一元分析



      現在,您可以通過使用meta summarize和meta forestplot的新選項leaoneout來執行留一元分析。留一元分析通過在每次分析中排除一項研究來執行多種元分析。研究通常會產生夸大的效應大小,這可能會扭曲整體結果。留一元分析可用于研究每項研究對總體效應量估計的影響,并確定有影響力的研究。

    • 12. 貝葉斯縱向/面板模型



      通過使用xtreg表示連續結果,xtlogit或xtprobit表示二進制結果,xtologit或xtoprobit表示序數結果等,可以擬合隨機效應面板數據模型。在Stata 17中,您可以簡單地通過在它們前面加上Bayes前綴來擬合這些模型的Bayesian版本。

    • 13. 面板多項邏輯模型



      Stata的新估計命令xtmlogit可使用面板多項邏輯(MNL)模型,以對隨時間推移觀察到的分類結果進行分類。假設我們手機了幾個星期關于個人對餐館選擇的數據。餐館的選擇是沒有自然排序的分類結果,因此我們可以使用現有的mlogit命令(帶有聚類穩健的標準誤)。但是xtmlogit直接對單個特征建模,因此可能會產生更有效的結果。并且它可以很好地解釋可能與協變量相關的特征。

    • 14. 零膨脹排序邏輯模型



      新的估計命令ziologit適合零膨脹排序邏輯回歸模型。這個模型是在當數據在最低類別中的觀測值比例高于標準有序邏輯模型的預期值時使用的。我們將最低類別中的觀測值稱為零,因為它們通常對應于某一行為或特征的缺失。零膨脹是通過假設零同時來自邏輯模型和有序邏輯模型來解釋的。每個模型可以具有不同的協變量,并且結果可以顯示為優勢比而不是默認系數。

    • 15. 貝葉斯多層次模型:非線性、聯合、類SEM等



      您可以使用bayesmh命令的新的精美隨機效果語法來擬合貝葉斯多級模型的廣度。您可以更輕松地擬合單變量線性和非線性多級模型?,F在,您可以擬合多元線性和非線性多級模型!考慮增長線性和非線性多級模型,聯合縱向和生存時間模型,SEM型模型等等。

    • 16. 貝葉斯動態預測



      在擬合多元時間序列模型(例如向量自回歸(VAR)模型)之外,動態預測是一種常見的預測工具。擬合經典var模型后,可以使用fcast計算動態預測。 使用bayes:var擬合貝葉斯var模型后,現在可以使用bayesfcast 來計算貝葉斯動態預測。貝葉斯動態預測會生成整個預測值樣本,而不是像傳統分析中那樣生成單個預測。該樣本可用于解答各種建模問題,例如,在估計預測不確定性時,在不做出漸近正態性假設的前提下,該模型對未來觀測的預測程度如何。這對于可能會出現漸近正態性假設的小型數據集尤其有吸引力。

    • 17. 貝葉斯IRF與FEVD分析



      脈沖響應函數(IRF),動態乘數函數和預測誤差方差分解(FEVD)通常用于描述多元時間序列模型(例如VAR模型)的結果。VAR模型具有許多參數,可能難以逐個解釋。 IRFs和其他函數將多個參數的影響合并為一個摘要(每個時間段)。例如,IRFs測量一個變量對給定結果變量的沖擊(變化)的影響。貝葉斯IRFs(和其他函數)使用IRFs的“精確”后驗分布產生結果,這不依賴于漸近正態性的假設。它們還可以為小型數據集提供更穩定的估計,因為它們合并了有關模型參數的先驗信息。

    • 18. 使用 BIC 選擇Lasso懲罰參數



      懲罰參數的選擇是lasso分析的基礎。套用少量的懲罰可能會包含太多變量。套用較大的懲罰可能會忽略潛在的重要變量。lasso估計已經提供了幾種懲罰選擇方法,包括交叉驗證,自適應和插件?,F在,您可以使用貝葉斯信息準則(BIC)通過指定selection(bic)選項在Lasso進行預測和Lasso進行推理之后選擇懲罰參數。同樣,在擬合Lasso模型后,新的后估計命令bicplot將BIC值繪制為懲罰參數的函數。這為懲罰參數的值提供了方便的圖形表示形式,從而使BIC功能最小化。

    • 19. lasso聚類數據



      現在,您可以在Lasso分析中解釋集群數據。忽略聚類可能會導致錯誤結果,因為同一聚類中的觀測值之間存在相關性。使用Lasso命令進行Lasso和Elasticnet等預測,您可以指定新的cluster({\ it clustvar})選項。使用Lasso命令進行推斷(例如:poregress),您可以指定新的vce(cluster {\ it clustvar})選項。

    • 20. 貝葉斯線性和非線性DSGE模型



      現在,可以通過在dsge和dsgenl前面加上前綴Bayes:來擬合貝葉斯線性和非線性動態隨機一般均衡(DSGE)模型。通過從30多種不同的先驗分布中進行選擇,合并有關模型參數范圍的信息。執行貝葉斯IRF分析,執行區間假設檢驗,使用貝葉斯因子比較模型等等。


    • 21. Jupyter Notebook與Stata



      Jupyter Notebook是一個功能強大且易于使用的Web應用程序,它允許您將在單個文檔(“筆記本”)中將可執行代碼、可視化、數學方程式和公式、敘述文本以及其他富媒體組合在一起,以進行交互式計算和開發。 它已被研究人員和科學家廣泛使用,以分享他們的想法和成果,進行協作和創新。
      在Stata 17中,作為PyStat的一部分,您可以使用IPython(交互式Python)內核從Jupyter Notebook調用Stata和Mata。這意味著您可以在一個環境中結合使用Python和Stata的功能,以使您的工作易于復制和與他人共享。
      從Jupyter Notebook調用Stata是由新的pystata Python軟件包驅動的。


    • 22. 日期和時間的新功能



      Stata 17增加了新的便利功能,用于處理Stata和Mata中的日期和時間。 新功能可以分為三類:
      1.Datetime持續時間:旨在獲取持續時間的函數(例如ages)。
      2.相對日期:基于其他日期返回日期的函數,例如相對于給定日期的下一個生日。
      3.Datetime組件:從日期時間值中提取不同成分的函數。

      新功能將閏年,閏日和閏秒(如果適用的話)考慮在內。
      閏秒是一秒的調整,偶爾會應用于協調世界時(UTC)。

    • 23. Intel數學內核庫(MKL)



      Stata 17引入了在兼容硬件(所有基于Intel和AMD的64位計算機)上使用Intel Math Kernel Library(MKL)的方法,并提供了深度優化的LAPACK例程。
      LAPACK是線性代數包的縮寫,它是一套用于求解聯立方程組、特征值問題和奇值問題等的程序。Mata運算符和函數(如qrd()、lud()和cholesky())在可能的情況下利用LAPACK進行許多數值操作。
      由英特爾MKL支持的LAPACK提供了最新的LAPACK例程,這些例程針對現代Intel和現代AMD處理器使用的64位Intel x86-64指令集進行了優化。使用MKL的Mata函數和運算符在性能方面大有裨益。最重要的是,您無需采取任何措施即可充分利用速度的提高。使用這些Mata函數和運算符的Stata命令以及Mata函數和運算符本身,將在兼容硬件上自動使用Intel MKL。

    • 24. Stata on Apple Silicon



      Stata 17 for Mac是一款通用應用程序,可以在Apple Silicon和Intel處理器的Mac上運行。采用Apple Silicon的Mac電腦包括新款MacBook Air、MacBook Pro和Mac mini,均采用M1處理器。M1芯片承諾有更高的性能和更大的功能效率。這對于我們的Stata-for-Mac用戶來說是值得注意的,他們中的許多人使用Mac筆記本電腦。
      雖然第一套M1 mac被認為是入門級的,但我們發現,本機運行Stata的M1 mac比英特爾mac的性能要好30-35%。它們的性能甚至遠遠超過價格超過兩倍的Intel Mac!對于只堅持在其Apple Silicon Mac上使用Apple-Siliconnative軟件的用戶,從安裝程序到應用程序本身,Stata 17的任何部分都不需要用到Rosetta 2。
      無論您是在M1 Mac上還是在Intel Mac上本地運行Stata,Stata的功能都相同,并且M1 Mac不需要特殊的許可證。英特爾Mac用戶應注意,未來幾年,我們將繼續支持并發布適用于英特爾處理器的Mac的新版本Stata。


    • 25. JDBC


      將Stata與數據庫連接變得更加容易了。Stata 17添加了對JDBC(Java數據庫連接)的支持。 新的jdbc命令支持JDBC標準,用于與具有矩形數據的關系數據庫或非關系數據庫管理系統交換數據。您可以從一些最受歡迎的數據庫供應商中導入數據,例如Oracle,MySQL,Amazon Redshift,Snowflake,Microsoft SQL Server等。
      jdbc的優點在于它是一個跨平臺的解決方案,因此我們的JDBC設置適用于Windows,Mac和Unix系統。如果您的數據庫供應商提供了JDBC驅動程序,則可以下載并安裝該驅動程序,然后通過jdbc在數據庫上讀取,寫入和執行SQL。 您可以將整個數據庫表加載到Stata中,也可以使用SQL SELECT將表中的特定列加載到Stata中。您還可以將所有變量插入數據庫表中,或僅插入數據集的子集。

    • 26. Java集成


      在Stata 17中,您現在可以直接在Stata中嵌入和執行Java代碼。您可以在以前的Stata版本中創建和使用Java插件,但這需要您編譯代碼并將其打包到Jar文件中。在do文件中執行Java可以讓您自由地執行直接與Stata代碼綁定的Java代碼?,F在,您可以在do-file或ado-file中編寫Java代碼,甚至可以從Stata中交互式地調用Java(如JShell)。
      Java的優勢之一在于與Java虛擬機打包在一起的廣泛的APIs。還有許多有用的第三方庫。根據您需要執行的操作,您甚至可以編寫并行代碼以利用多核運算。您編寫的Java代碼可以即時編譯,無需使用外部編譯器!此外,還包括Stata函數接口(SFI)Java軟件包,提供了Stata與Java之間的雙向連接。
      SFI包具有訪問Stata當前數據集,幀,宏,標量,矩陣,值標簽,特征,全局Mata矩陣,日期和時間值等的類。Stata將Java開發工具包(JDK)與其安裝捆綁在一起,因此不涉及其他設置。

    • 27. H2O集成


      在Stata 17中,我們一直在嘗試連接H2O,H2O是一種可擴展的分布式開源機器學習和預測分析平臺。您可以在https://docs.h2o.ai/上了解有關H2O的更多信息。
      借助H2O的集成,您可以從Stata上啟動,連接和查詢H2O集群。此外,我們提供了一組命令來處理集群上的數據(H2O幀)。例如,您可以通過導入數據文件或加載Stata的當前數據集來創建新的H2O框架。您還可以在Stata內部拆分,組合和查詢H2O幀。盡管對于我們來說,這仍處于試驗階段,但我們希望將其提供給我們的用戶進行試用。
      另一方面,由于它是實驗性功能,因此語法和功能可能會發生變化。使用提供對H2O特定功能的訪問的Stata命令時,請記住這是H2O功能。盡管您可能通過Stata命令訪問它,但它的工作取決于H2O,并且不在Stata范圍內。


    • 28. do文件編輯器:導航,增強書簽…



      Stata 17中的“文件”編輯器進行了以下改進:
      1. 書簽:現在與do文件一起保存。
      2. 新的導航控件:可以輕松瀏覽do文件。
      3. 語法高亮顯示支持現已包括Java和XML。
      4. 選區中引號,括號和方括號的自動補全。 例如,選擇文本mymacro,然后輸入左引號`;。 然后,文件編輯器將用單引號將文本選擇綁定,將選擇更改為“ mymacro”。
      書簽:do文件編輯器最需要的功能之一是能夠將書簽保存在do文件中。書簽用于標記感興趣的行,以便以后更輕松地導航到它們。書簽在瀏覽長do文件時特別有用。 您可以將書簽添加到您的do文件的各個部分,以執行數據管理,顯示摘要、統計信息并執行統計分析。然后,您可以使用菜單、工具欄或新的導航控件在這些部分之間快速來回移動,而無需滾動幾行代碼來查找所需的部分。
      導航: Stata 17通過新的導航控件使do文件的導航更加容易,該控件顯示書簽及其標簽的列表。從導航控件中選擇一個書簽會將“do文件編輯器”移至書簽所在的行。除了書簽之外,導航控件還將顯示do文件中的程序列表。從導航控件中選擇一個程序會將“do文件編輯器”移至該程序的釋義。無需將其他程序添加到“導航”中。 DO文件編輯器將自動將程序的釋義添加到導航控件中。

    • 29. 非參數的趨勢檢驗



      現在,nptrend命令支持四種跨有序組的趨勢檢驗。您可以在the Cochran–Armitage test, the Jonckheere–Terpstra test, the linear-by-linear trend test, and the Cuzick test using ranks之間進行選擇。前三個檢驗是新的,而第四個檢驗由nptrend先前執行。


    • Lasso


      作為大數據Volume的一種重要形式,“高維數據”(high-dimensional data)解釋變量很多,甚至超過樣本容量。Lasso (Least Absolute Shrinkage and Selection Operator,也稱“套索估計量”)及其衍生的系列估計量正是進行高維回歸的主要工具。
      Lasso系列的官方命令,包括lasso, elasticnet(彈性網)與 sqrtlasso(平方根Lasso),可估計線性回歸模型(比如 lasso linear)、二值選擇模型(比如,lasso logit 與 lasso probit)、計數模型(比如,lasso poisson)等。
      Lasso 系列的估計量通常使用懲罰回歸(penalized regressions)來處理高維數據,以避免“過擬合”(overfit)與“方差爆炸”(variance explosion),并進行“變量選擇”(variable selection)。這些懲罰回歸對于回歸系數過大的懲罰力度則一般由調節參數(tuning parameter)或 L1范數(L1 norm)來控制。
      使用 Stata 16的Lasso命令,可以很方便地計算回歸系數的整個路徑(coefficient paths),作為調節參數 或 L1范數的函數;并根據“交叉驗證”(cross-validation)選擇最優的調節參數 ,參見下圖。




      Stata 官方命令還提供了 Lasso 系列相應的統計推斷方法,比如計算標準誤、置信區間,或進行假設檢驗。這些統計推斷方法包括“double-selection lasso”(比如,dsregress,dslogit,dspoisson),“partialling-out lasso”(比如,poregress,pologit,popoisson),以及“cross-fit partialing out lasso”(比如,xporegress,xpologit,xpopoisson)。


    • Multiple Datasets in Memory


      在大數據時代,學界與業界越來越需要在內存中同時處理多個數據集。在此前的 Stata 版本中,Stata 內存只能有一個數據集。這種設置雖簡便易行,在小數據時代也基本夠用,但在大數據時代,由于數據的來源 Variety 多樣,已成為應用的瓶頸。
      因此,Stata 適時地推出在內存內同時調用多達100個數據集的重要功能。比如,你可以很方便地根據內存中多個數據集的信息來定義一個新的變量。


    • Python Integration


      隨著機器學習與數據科學的興起,Python 無疑是最炙手可熱的編程語言之一。為此,Stata 16 專門提供了一個與 Python 的接口,讓用戶可以在熟悉的 Stata 界面下調用 Python,并在 Stata 中顯示運行結果。
      比如,此前的 Stata 版本無法畫三維立體圖,而在Stata 16中,通過調用Python 的 Matplotlib 則不難實現(參見下圖)。


      這也意味著,你可以在 Stata 中,通過 Python 接口,使用 Python 所擅長的各種機器學習方法,包括隨機森林、梯度提升、支持向量機、神經網絡等!


    • Do-file Editor -- Autocompletion and More Syntax Highlighting


      在大數據時代,編程越來越成為一種基本技能。在 Stata 中編程,無疑需要一個很好的 do 文件編輯器(Do-file Editor)。 讓人驚喜的是,Stata 的 do 文件編輯器的性能也有了大幅提升,包括 Stata 命令的自動填寫完成(autocompletion),以及更多語法高亮顯示(syntax highlighting),這無疑將為 Stata 編程提供很大便利。


    • Meta-Analysis


      Stata 提供了全新的 Meta-Analysis 模塊,使得元分析變得十分方便、快捷而高效,并輔之以強大的可視化功能(參見下圖)。


    • Reporting


      由于大數據的更新頻繁特點(Velocity),使得數據分析經常需要重復進行,使用更新的數據。此時,研究報告的可重復性(Reproducibility)就變得日益重要,即保證任何人只要運行你的 Stata 程序即可得到完全一樣的研究報告。這些研究報告的格式可以是 Word,PDF,Excel 或 HTML(參見下圖)。 隨著大數據時代的數據來源 Variety 越來越多,使得我們時常需要將不同來源的樣本數據之研究結果整合在一起,即所謂“元分析”(Meta-Analysis)。


      而且,當你的數據集更新之后,再運行一遍你的 Stata,則你的研究報告也會相應地自動更新!Stata 16 新引入或完善的相關命令包括 dyndoc,markdown,putdocx,html2docx,doc2pdf。

      小貼士:還在發愁如何將 Word 文件轉化為 PDF 格式?Stata 16 的 doc2pdf 命令就能幫你搞定!

    • Import Data from SAS and SPSS


      如果你有數據在 SAS 或 SPSS 中,想要導入 Stata 以利用其強大的統計與計量功能,Stata 16 貼心地提供了專門的新命令 import sas 與 import spss,使得這種數據遷移變得十分方便與快捷,參見下圖。




    • Stata 深耕計量經濟學的經典與前沿方法


    • Nonparametric Series Regression


      序列回歸(series regression)是非參數回歸(nonparametric regression)的一種重要方法。它使用多項式(polynomials)、B-樣條(B-splines)或樣條(splines)所構成的序列來近似逼近任意的未知回歸函數。

      Stata 推出的命令 npregress series 填補了 Stata 在非參數回歸領域的又一空白,使得非參數序列回歸變得方便而高效;比如,計算平均邊際效應(average marginal effects)。命令 npregress series 甚至可以估計“半參數模型”(semi-parametric model),即同時包含參數與非參數部分的模型。

    • Choice Models


      對于微觀計量中常用的“離散選擇模型”(discrete choice models),Stata 設立了一個“選擇模型”(Choice Models)的模塊。在估計選擇模型之前,你先通過命令 cmset 來宣布你的數據為選擇模型,然后可用命令 cmsummarize,cmchoiceset,cmtab 或 cmsample 來考察你的選擇模型。
      估計選擇模型的相應 Stata 命令也統一帶上了 cm 的前綴,比如
      cmclogit:conditional logit model
      cmmixlogit:mixed logit model
      cmxtmixlogit:panel-data mixed logitmodel
      cmmprobit:multinomial probitmodel
      cmroprobit:rank-ordered probitmodel
      cmrologit:rank-ordered logitmodel
      其中,cmxtmixlogit 是 Stata 16的全新命令,用于估計面板數據的混合邏輯模型(mixed logit models for panel data)。

    • Panel-data ERMs


      Stata 15 推出了 ERM(Extended Regression Models)模塊,可以處理同時出現“內生性”(endogeneity)、“樣本選擇”(sample selection)與“處理效應”(treatment)這三種并發癥的情形,或三者的任意組合,非常靈活實用。Stata 16 則將ERMs 推廣到了面板數據中,新引入了xtegress,xteintreg,xteprobit,xteoprobit 等強大命令。

    • New in Bayesian Analysis


      Stata 的“貝葉斯分析”(Bayesian Analysis)模塊也有了不少新功能。比如,可使用多個馬爾科夫鏈(multiple chains)來檢驗現代貝葉斯分析所依賴的馬爾科夫鏈蒙特卡洛(Markov China Monte Carlo)是否收斂;以及使用后驗分布(posterior distribution)進行“貝葉斯預測”(Bayesian predictions),參見下圖。


    • Nonlinear DSGE Models


      tata 可以通過命令 dsgenl 來估計非線性 DSGE 模型。 使用命令dsgenl,無須再手工將 DSGE 模型線性化,直接輸入非線性的 DSGE 模型,Stata 即會自動地對它進行線性化與估計。

    • xtheckman


      xtheckman命令 使得 Heckman 的樣本選擇模型(sample model)也可以在面板數據中估計。


    系統要求

    Stata for Windows
    Windows 11*
    Windows 10 *
    Windows Server 2022, 2019, 2016, 2012R2 *
    * Stata requires 64-bit Windows for x86-64 processors made by Intel? or AMD (Core i3 equivalent or better)

    Stata for Mac
    Mac with Apple Silicon or Intel processor (Core i3 or better)
    macOS 11.0 (Big Sur) or newer for Macs with Apple Silicon and macOS 10.13 (Sierra) or newer for Macs with 64-bit Intel processors

    Stata for Linux
    Any 64-bit (Core i3 equivalent or better) running Linux
    Minimum requirements include the GNU C library (glibc) 2.17 or better and libcurl4
    Check the output of ldd -v within a terminal
    For xstata, you need to have GTK 2.24 installed

    Hardware requirements

    Package Memory Disk space
    Stata/MP 4GB 2GB
    Stata/SE 2GB 2GB
    Stata/BE 1GB 2GB

    Stata for Linux requires a video card that can display thousands of colors or more (16-bit or 24-bit color)




    在世界已邁入大數據新時代的今天,Stata 在高校商科類專業、科研院所以及企業界的應用越來越廣泛,已成為各大高校必備的專業軟件,隨著其用戶群體的不斷擴大,建立中國用戶與 Stata 總部之間的溝通和磋商機制越發成熟。聆聽用戶的心聲,收集業界專家的論點與建議,已成為會議的主旨,無論您是為科研應用之路尋找最佳解決方案, 還是專注 Stata 軟件探索與研究,抑或是竭力于提高工作效率的數據處理技能,在 Stata 中國用戶大會上,您的需求都能得到前所未有的碰撞與共鳴。故 Stata 中國用戶大會(China Stata Users' Conference)由此誕生,由北京友萬信息科技有限公司(Beijing Uone Info&Tech Co.,Ltd)和StataCorp LLC原廠聯合發起,規劃每年舉辦一屆,通過廣泛的國際學術交流,幫助 Stata 中國用戶探索更深層次的理論和研究。我們希望通過每年一屆的 Stata 用戶會議,讓 Stata 中國用戶及學者提高自身軟件應用水平,開辟“學中用、用中學”的創新學習模式,打造強有力的學術氛圍,幫助中國用戶建立完善的軟件技術服務體系,形成中國用戶之間的技術、經驗交流平臺。



    往屆 Stata 中國用戶大會資源免費奉送,關注 Stata 的小伙半們抓緊時間領取咯!


    第七屆 Stata 中國用戶大會概況


    2023 年第七屆 Stata 中國用戶大會將于 8 月 13 日至 14 日在哈爾濱商業大學舉辦。
    為促進高水平商科特色高校建設與經濟學等其他學科的交叉融合,會議圍繞“東北全面振興與高水平商科大學建設背景下的經濟學實證統計方法”為主題,積極開展跨學科的探索性研究與統計相關的研究。會議以數字經濟為背景,運用跨界思維和方法,將新技術、新理念、新模式,新方法融入商科教育。您可以與來自各領域頂尖的 Stata 專家及 Stata 研發工程師一起分享有價值的見解及 Stata 18 新功能、新命令,學習最前沿的科研方法并提高您的 Stata 應用知識。會議同期還將全新推出《Stata 夏令營活動》,無論您是初學者還是專家,歡迎加入我們,并利用這一獨特的機會來學習使用 Stata 的新方法!置身于美麗的哈爾濱,穿過百年中央大街,探訪中華巴洛克歷史文化街區,漫步美麗松花江畔,享受為期兩天的 Stata 會議和交流時光!




    第六屆 Stata 中國用戶大會概況


    第六屆 Stata 中國用戶大會于2022年8月19-20日在線盛大召開。您可以與來自各領域頂尖的 Stata 專家及 Stata 研發工程師一起分享有價值的見解及新命令,學習最前沿的科研方法并提高您的 Stata 應用知識。會議同期還將全新推出《Stata大師課》+《Stata公開課》的夏季聯學營活動,無論您是初學者還是專家,歡迎加入我們,并利用這一獨特的機會來學習使用 Stata 的新方法。


    演講主題 演講人
    《Mastering Stata's datetime concepts and functions》 彭   華    StataCorp LLC
    《動態隨機一般均衡模型的貝葉斯估計》 王群勇    南開大學
    《合成控制法(SCM)的安慰劑檢驗、穩健性檢驗及可視化操作》 顏冠鵬    山東大學
    《Stata中的標準誤》 陳   強    山東大學
    《Creating Custom Estimation Tables》 呂   丹    StataCorp LLC
    《模型平均化(Model Averaging)及其在經濟金融領域的應用》 連玉君    中山大學
    《使用網絡方法研究經濟學問題》 神秘嘉賓
    《綠色全要素生產率與高質量發展評估》 張   寧    山東大學

    —> 前往下載大會資源


    第五屆 Stata 中國用戶大會概況


    第五屆 Stata 中國用戶大會暨“Stata 高級研究方法及新應用研討會”于2021年8月19-20日盛大召開。聚焦學術前沿,對話學界大咖,多層次解讀 Stata 17新應用。StataCorp LLC選派技術總工及開發者出席會議,與國內一線專家共襄盛舉,共享 Stata 應用新思路。


    會議主題:Stata高級研究方法及新應用研討會

    演講主題 演講人
    《Stata 17 自定義表格新應用》 彭   華    StataCorp LLC
    《Global VAR and Bayesian VAR in Stata》 王群勇    南開大學
    《回歸控制法及Stata應用》 顏冠鵬    山東大學
    《分位數控制法及Stata應用》 陳   強    山東大學
    《因果推斷中的Stata應用》 王存同    中央財經大學
    《Fitting Cox proportional hazards model for interval-censored event-time data in Stata》 楊   筱    StataCorp LLC
    《雙邊隨機邊界模型的Stata應用》 劉   暢    中山大學學
    《優質稿件 | songbl命令的使用介紹:stata推文與電腦文檔的檢索》 楊景院    深圳大學
    《一個Stata用戶的若干思考》 連玉君    中山大學
    《合成控制法的Stata應用和前沿研究》 陸嘉炫    芝加哥大學
    《Mixed Regression with Macro and Micro Data in Stata》 王群勇    南開大學

    —> 前往下載大會資源


    第四屆 Stata 中國用戶大會概況


    2020年隨著新冠疫情的蔓延,全球都投入到積極防控的大潮中,如何高效獲取和處理COVID-19數據,必然成為本屆會議的熱點主題 。第四屆“Stata中國用戶大會”(China Stata Users' Conference) 將以“新應用+智交互”為主題,力邀國內外行業領袖及學術專家,共同開啟全新主題單元。本次會議以線上直播的方式與大家見面,知識碰撞、經驗交流、共享Stata應用新思路。


    會議主題:新應用+智交互研討會

    演講主題 演講人
    《使用Stata獲取與處理COVID-19數據》 彭   華    StataCorp LLC
    《Call Stata from Python》 徐   朝    StataCorp LLC
    《混頻回歸方法與Stata應用》 王群勇    南開大學
    《基于Stata模擬的內生性來源及其應對》 陳傳波    中國人民大學
    《跨度回歸、偏度回歸與峰度回歸及Stata應用》 陳   強    山東大學
    《平滑轉換模型與Stata應用》 王群勇    南開大學
    《Causal Mediation》 金承剛    北京師范大學
    《合成控制法安慰劑檢驗改進研究——基于標準化處理效應和非拒絕域的統計推斷》 連玉君    中山大學
    《Measuring technical efficiency and total factor productivity change with undesirable outputs in Stata》 王道平    上海財經大學

    —> 前往下載大會資源




    第三屆 Stata 中國用戶大會概況


    第三屆 Stata 中國用戶大會暨“機器學習與計量方法應用研討會”于2019年8月20—21日在上海財經大學盛大召開并取得圓滿成功。會議得到了國內外專家學者及眾多用戶代表的一致肯定,同時今年也是 Stata 16發布年,在會議上我們也希望能夠更多的了解對新版本的認知,反映中國用戶在應用軟件過程中遇到的問題。通過廣泛的國際交流,幫助 Stata 中國用戶探索更深層次的理論和研究。


    會議主題:機器學習與計量方法應用研討會

    演講主題 演講人
    《Introduction of latest reporting and language extension features in Stata》 彭   華    StataCorp LLC
    《Stata在公司投融資研究中的應用》 覃家琦    南開大學
    《分位數回歸:橫截面、面板與工具變量法》 陳   強    山東大學
    《Inference after lasso model selection》 劉   迪     StataCorp LLC
    《非參數計量經濟方法(核回歸,局部線性回歸)》 王群勇    南開大學
    《Fixed effect panel threshold model for unbalanced panel》 王群勇    南開大學
    《Stata在外匯市場實證中的應用》 丁劍平    上海財經大學
    《人工智能+ Stata》 陳堰平    微軟中國


    —> 前往下載大會資源



    第二屆 Stata 中國用戶大會概況


    2018年“第二屆 Stata 中國用戶大會”(2018China Stata Users' Conference)是由北京友萬信息科技有限公司(簡稱:友萬科技)主辦,順德職業技術學院承辦的聚焦 Stata 應用與技術落地的盛會。會議核心內容將圍繞計量經濟方法及應用方向展開廣泛的國際學術交流,內容覆蓋經濟學、金融學、會計學、計算語言學、新聞學、政治學、歷史學、醫藥衛生等微觀和宏觀計量分析的熱門應用領域。今年大會的主題是“Econometric Analysis Method and Application” 秉承“開放協作、技術共享”的宗旨,面對面真誠聆聽用戶的聲音。致力于為業界帶來最新技術、行業應用案例展示與最佳實踐單元。



    會議主題:Econometric Analysis Method and Application

    演講主題 演講人
    《大數據、高維回歸與Stata》 陳   強    山東大學
    《Spatial autoregressive models using Stata》 劉   迪    StataCorp LLC
    《政策評估與因果推斷:Stata應用概述》 王群勇    南開大學
    《斷點回歸》 連玉君    中山大學
    《回歸分析集成輸出解決方案》 李春濤    華中科技大學
    《內含資本成本的計算》 顧   俊    深圳大學
    《樣本選擇問題與處理》 王群勇    南開大學
    《DSGE在Stata中的應用》 許文立    安徽大學
    《Report generation with putdocx, putexcel, putpdf, and dyndoc》 彭   華    StataCorp LLC

    —> 前往下載大會資源


    第一屆 Stata 中國用戶大會概況


    2017年“第一屆 Stata 中國用戶大會”(2017 China Stata Users' Conference)是由北京友萬信息科技有限公司和爬蟲俱樂部,聯合StataCorp LLC發起第一屆Stata中國用戶大會。首屆Stata用戶會議的宗旨是“溝通和合作”,我們希望通過定期舉辦 Stata 用戶會議,形成中國用戶之間的技術、經驗交流平臺;建立和 Stata 原廠的溝通機制,反映中國用戶遇到的問題,讓未來的Stata版本更多地反映中國用戶的愿望;建立學界與企業界之間的溝通和聯系,讓 Stata 用戶有更多的機會服務于企業界;打造數據分析領域的高端智庫,服務于我國的大數據事業。


    會議主題:Retrieving data from website, Cloud oriented empirical analysis, Using Chinese in Stata

    演講主題 演講人
    《Stata 15 新版本發布及新功能研討》 彭   華    StataCorp LP 軟件工程總監
    《內生性問題:方法及進展》 連玉君    中山大學
    《putdocx與格式化輸出》 李春濤    中南財經政法大學
    《unicode與中文編碼》 彭   華    StataCorp LP 軟件工程總監
    《Stata函數》 彭   華    StataCorp LP 軟件工程總監
    《Subinfile,網頁源代碼分析的神器》 薛   原    爬蟲俱樂部
    《Stata自動化報告與可重復研究》 陳堰平    雪晴數據網
    《分詞與情感分析》 薛   原    爬蟲俱樂部
    《文本分析在量化文史學研究中的應用—以<唐書>與<紅樓夢>為例》 俞俊利    上海交通大學
    《Stata、cURL交互與網絡爬蟲:以微博API為例》 彭文威    香港科技大學
    《Stata數據清洗常用技巧》 彭文威    香港科技大學
    《Econometric convergence test and club clustering using Stata》 杜克銳    山東大學

    —> 前往下載大會資源


    印刷書籍 查看更多


    Interpreting and Visualizing Regression Models Using Stata, Second Edition

    作者: Michael N. Mitchell
    出版商: Stata Press
    版權: 2021
    ISBN-13: 978-1-59718-321-5
    頁數:610; paperback

    Data Management Using Stata: A Practical Handbook, Second Edition

    作者: Michael N. Mitchell
    出版商: Stata Press
    版權: 2020
    ISBN-13:978-1-59718-318-5
    頁數:532; paperback

    Introduction to Time Series Using Stata, Revised Edition

    作者: Sean Becketti
    出版商: Stata Press
    版權: 2020
    ISBN-13: 978-1-59718-306-2
    頁數:446; paperback

    Generalized Linear Models and Extensions, 4th Edition

    作者: James W. Hardin和Joseph M. Hilbe
    出版商: Stata Press
    版權: 2018
    ISBN-13: 978-1-59718-225-6
    頁數: 598; 平裝

    A Gentle Introduction to Stata, 6th Edition

    作者: Alan C. Acock
    出版商: Stata Press
    版權: 2018 ISBN-13: 978-1-59718-269-0
    頁數: 570; 平裝

    The Mata Book: A Book for Serious Programmers and Those Who Want to Be

    作者: 威廉W.古爾德
    出版商: Stata Press
    版權: 2018
    ISBN-13: 978-1-59718-263-8
    頁數: 428; 平裝

    Survey Weights: A Step-by-Step Guide to Calculation

    作者: Richard Valliant和Jill A. Dever
    出版商: Stata Press
    版權: 2018
    ISBN-13: 978-1-59718-260-7
    頁數: 183; 平裝

    A Course in Item Response Theory and Modeling with Stata

    作者: Tenko Raykov和George A. Marcoulides
    出版商: Stata Press
    版權: 2018
    ISBN-13: 978-1-59718-266-9
    頁數: 270; 平裝

    電子書籍 查看更多


    Interpreting and Visualizing Regression Models Using Stata, Second Edition

    作者: Michael N. Mitchell
    出版商: Stata Press
    版權: 2021
    ISBN-13: 978-1-59718-321-5
    頁數:610; paperback

    Data Management Using Stata: A Practical Handbook, Second Edition

    作者: Michael N. Mitchell
    出版商: Stata Press
    版權: 2020
    ISBN-13:978-1-59718-318-5
    頁數:532; paperback

    Introduction to Time Series Using Stata, Revised Edition

    作者: Sean Becketti
    出版商: Stata Press
    版權: 2020
    ISBN-13: 978-1-59718-306-2
    頁數:446; paperback

    Discovering Structural Equation Modeling Using Stata, Revised Edition

    Alan C. Acock

    An Introduction to Stata for Health Researchers, Fourth Edition

    Svend Juul and Morten Frydenberg

    A Gentle Introduction to Stata, Sixth Edition

    Alan C. Acock

    The Workflow of Data Analysis Using Stata

    J. Scott Long

    An Introduction to Modern Econometrics Using Stata

    Christopher F. Baum

    Stata Journal 期刊


    Stata Journal為每季發行的期刊,包含了統計、資料分析、教學方法、有效地使用Stata語言及書籍回顧…等相關內容。 使用者亦可選擇購買有興趣的單篇文章。

    ISI Web of Knowledge 的最新期刊引用報告,將Stata期刊列為社會科學數學方法類別期刊中的第四位,僅次于結構方程模型, 計量經濟學和經濟學與統計學評論。


    點擊了解更多相關期刊內容

    Stata原廠相關鏈接


    >>最終用戶授權許可協議(EULA)

    >>中國Stata Prof+ Plan計劃的名單

    >>Stata Maintenance介紹

    >>教學視頻

    >>在線培訓
    >>更多學習資源
    >>官方博客










    為順應大數據時代要求,自開展Stata培訓以來,我司通過活動路演、創新講座、在線課程、線下培訓等系列活動已經在全國開展了包含Stata應用方法、統計分析、文本分析、數據分析、數據清洗、Stata、cURL交互與網絡爬蟲、內生性問題的方法及進展、Stata編程與Mata運算、Stata編程技術與爬蟲、Stata自動化報告與可重復研究、計量經濟方法及Stata應用等學習活動,有近千余名師生及業界愛好者參與了學習。通過此類學習活動極大的加強了大數據分析人才的理論和實踐能力。推進了大數據人才培養,以及學術成果的轉化,為大數據分析領域發展做出了貢獻。我司希望通過每年一屆的Stata中國用戶大會,深度推進國內青年學者學習熱情,提升高校學術交流氛圍,整合學界及業內的大量資源,進一步提高數據分析能力和科學決策的水平。

    Stata 系列課程

    高級現場班:"面板數據與因果推斷" 研討會 (火熱報名中)

    主講:王群勇
    時間:2023年8月09-11日
    地點:哈爾濱商業大學

    課程概要
    基于面板數據 (Panel Data) 的因果推斷方法是目前實證分析的主流方法?;貧w模型是因果推斷的最重要的基礎,是實證分析的起點和基準。面板數據對于解決不可觀測異質性導致的內生問題具有天然的優勢。內生性問題是觀測數據中普遍存在的問題,是對因果關系的致命威脅。匹配法是因果推斷的流行方法。雙重差分法DID,通常用于政策效應類研究。斷點設計(RD)適用于政策是某個驅動變量的函數的情形。
    課程特色
    (1)理論方法與軟件操作密切結合,通過復現論文的實證結果提高實證研究的科學性和規范性。
    (2)為部分模型提供的專享程序包。
    (3)為學員的論文提供點評與討論,以及適當可能的合作。
    (4)提供電子版本講義及課件資源、Stata18正版軟件試用,確保用戶都能正常、安全的運行數據,保證上課質量!

    點擊了解課程詳情

    高級現場班:"異質性穩健DID及Stata應用" 研討會 (火熱報名中)

    主講:陳強
    時間:2023年8月12日
    地點:哈爾濱商業大學
    課程概要
    雙重差分法(DID)是最常見的因果推斷方法,近年來發展迅猛。估計多期DID的傳統方法為雙向固定效應估計量(TWFE),但此法依賴于處理效應的同質性假定;例如處理效應不隨時間而變。根據培根分解(Goodman-Bacon, 2021)可知,若存在異質性處理效應,則TWFE有偏差。在夯實截面處理效應與經典DID的知識后,本課程將重點介紹異質性穩健(在異質性處理效應情況下也成立)的主流估計方法及Stata應用,包括交互加權法(Sun and Abraham, 2021)、雙重穩健估計法(Callaway and Sant’Anna, 2021)、即時處理效應法(de Chasemartin and D’Haultfoeuille, 2020)與插補法(Borusyak et al., 2022);其中,前二者適用于交疊DID(staggered DID),而后二者也適用于政策可逆轉的一般DID(general DID)。
    課程特色
    (1)深入淺出介紹計量思想與原理。
    (2)結合經典案例講解Stata實操。
    (3)提供電子版本講義及課件資源、Stata18正版軟件試用,確保用戶都能正常、安全的運行數據,保證上課質量!

    點擊了解課程詳情

    高級現場班:"宏觀計量經濟模型" 研討會 (火熱報名中)

    主講:王群勇
    時間:2023年8月09-11日
    地點:哈爾濱商業大學

    課程概要
    宏觀數據典型地包括時間序列數據和長面板數據。與微觀數據不同,宏觀數據計量模型的分析方法更多地關注動態規律、平穩性與協整關系、以及截面相關或空間相關的問題。本期課程聚焦于宏觀數據的兩種因果推斷方法(干預時間序列分析和合成控制法)、變系數模型、動態異質面板的ARDL模型、空間計量經濟、以及全局VAR和面板VAR模型。
    課程特色
    (1)理論方法與軟件操作密切結合,通過復現論文的實證結果提高實證研究的科學性和規范性。
    (2)為部分模型提供的專享程序包。
    (3)為學員的論文提供點評與討論,以及適當可能的合作。
    (4)提供電子版本講義及課件資源、Stata18正版軟件試用,確保用戶都能正常、安全的運行數據,保證上課質量!

    點擊了解課程詳情

    高級課程:蒙特卡洛模擬、貝葉斯分析與Stata應用

    主講:王群勇
    課程概要
    蒙特卡洛方法是發展最為成熟的計算機模擬方法之一,最早是在1957年由Metropolis 和Ulam等針對中子輸運問題時提出的。蒙特卡洛方法在許多領域均有廣泛的應用,如統計物理、計算生物學、金融學以及人工智能等等領域。 貝葉斯統計為你提供了在新數據的證據中更新你的評估工具,這是一個在許多現實世界場景中常見的概念,如跟蹤大流行病,預測經濟趨勢,或預測氣候變化。貝葉斯統計是許多較著名的統計模型的支柱。

    點擊了解課程詳情

    高級課程:宏觀計量經濟分析與Stata、Mathematica應用

    主講:王群勇
    課程概要
    宏觀經濟是從宏觀、總體上研究國民經濟水平、結構、均衡、運行、穩定、調控和增長等的一個經濟研究范疇或領域。從宏觀、總體上研究國民經濟或者其某一方面,必然要和一些宏觀經濟變量及其所反映出的數據資料打交道,研究這些經濟變量之間的相互關系及其所反映出的宏觀經濟或其某一方面所具有的規律性,而這就需要采用宏觀經濟計量分析方法,建立宏觀經濟計量分析模型,并應用之。

    點擊了解課程詳情

    高級課程:貝葉斯分析與Stata應用

    主講:王群勇
    課程概要
    2021年4月20日Stata17全新發布,針對貝葉斯計量經濟學作出了全面升級,大部分更新圍繞貝葉斯進行了增強升級,主要包括:貝葉斯VAR模型 (Bayesian VAR models)、貝葉斯縱向/面板數據模型 (Bayesian longitudinal/panel-data models)、貝葉斯多層模型:非線性,聯合,SEM-like等(Bayesian multilevel models: nonlinear, joint, SEM-like, and more)、貝葉斯動態預測 (Bayesian dynamic forecasting)、貝葉斯IRF與FEVD分析 (Bayesian IRF and FEVD analysis)、貝葉斯線性與非線性DSGE模型(Bayesian linear and nonlinear DSGE models)。為了讓更多Stata用戶深入系統的學習貝葉斯分析理論,本次課程使用Stata 17最新版軟件授課,講述平凡而又神奇的貝葉斯分析方法。

    點擊了解課程詳情

    中級課程:面板數據計量分析與Stata應用

    主講:王群勇
    課程概要
    課程主要內容涵蓋面板數據的經典模型、動態面板、非線性面板模型、利用面板數據進行因果推斷、面板數據受限因變量模型、貝葉斯面板數據分析、面板空間計量模型等。

    點擊了解課程詳情

    初級課程:Stata 17新功能介紹課程

    主講:StataCorp LLC
    課程概要
    Stata 17 更新了可自定義的表格(table)可以很容易地創建表格 ,并通過靈活的表格命令輕松的收集結果??蓪⒈砀駥С龅組S Word?, PDF, HTML, LaTeX, MS Excel?, 并將它們插入到報告中。Stata 17還引入了PyStata的概念,涵蓋了Stata和Python可以交互的所有方式的術語。 本課程帶您快速了解Stata 17中的 table 和 PyStata 及其他一些新功能。

    點擊了解課程詳情

    初級課程:Stata 16軟件功能介紹課程

    主講:StataCorp LLC
    課程概要
    Stata16 新功能入門視頻,新增16+項主要功能特征,兩分鐘快速入門Stata,帶您一賭為快!

    點擊了解課程詳情

    初級課程:實證方法與Stata應用專題課程

    主講:王群勇
    課程概要
    從一個完整的案例掌握Stata操作技巧,適合新手小白的論文實證方法與Stata應用專題課程,緊緊圍繞實證研究中倍受困擾的問題進行詳細解讀。 每個模型結合經典論文進行案例分析和軟件操作。

    點擊了解課程詳情

    高級課程:“非線模型講述非常故事”專題課程

    主講:王群勇
    課程概要
    世界的本質是非線性的。如果我們覺得世界是平的,那只是因為我們的視野太窄了。在實證研究中,線性模型往往作為基準模型描述變量之間的整體平均關系,但“線性模型總是相似的,非線性模型各有各的非線性”,每一種非線性都可以講述一個不同尋常的故事。當估計完一個線性模型之后,是不是總覺得缺少什么?! 如何擺脫線性模型的單調和千篇一律?本課程帶領你學會如何從數據中挖掘與他人不一樣的精彩故事。 本課程主要介紹非線性模型的基本思想與算法,并結合具體案例,介紹Stata實踐操作。

    點擊了解課程詳情

    高級課程:“自然實驗與因果推斷”專題課程

    主講:王群勇
    課程概要
    因果推斷是微觀計量分析的重要特征之一。反事實是因果推斷的最基本框架,自選擇等問題導致的政策內生性給政策評估帶來諸多障礙。本課程介紹利用觀測數據進行因果推斷的幾大利器:如何利用自然實驗(或準實驗)推斷因果關系、如何克服政策的內生性問題、斷點設計如何減弱了政策內生性問題和模型錯誤設定問題、以及面板數據中如何利用雙重查分和合成控制構建反事實的策略。

    點擊了解課程詳情




    Stata 案例集


    為強化示范引領效果,加快推動高校Stata科研實驗室建設,由北京友萬信息科技有限公司聯合授權高校共同編制的《Stata案例集》正式發布。Stata案例集根據客戶成功案例收集整理而成,介紹了應用Stata軟件在科研工作和教學人材培養以及豐碩的科研成果方面取得的突出成效和變化,旨在幫助更多教學和科研單位根據其所屬的專業領域,參考如何高效的部署Stata軟件產品及解決方案。

    案例一:首都經濟貿易大學 國際經濟管理學院



    案例二:南開大學 經濟學院



    案例三:西南政法大學 經濟學院



    Stata實驗室建設計劃

    北京友萬信息科技有限公司自成為Stata中國授權經銷商及合作伙伴以來,已為國內數十所高等院校及科研院所完成了Stata科研實驗室采購計劃。幫助其在教學科研、人材培養,論文發表、學科建設方面取得了突破性的進展。解決了在數據分析、數據處理、可視化、統計分析和自動報告等多方面的業務問題和個性化需求。對提高科研人員與教師的科學研究能力和教學水平起到了尤為重要的作用,誠邀有意向的單位加入我們,共同建立適合您的實驗室定制建設方案。


    立即獲取定制方案 >