etl是什麼的問題,透過圖書和論文來找解法和答案更準確安心。 我們找到下列懶人包和總整理

etl是什麼的問題,我們搜遍了碩博士論文和台灣出版的書籍,推薦(美)卡斯特寫的 Pentaho Kettle解決方案:使用PDI構建開源ETL解決方案 可以從中找到所需的評價。

另外網站我国政府绩效评估基础问题研究 - Google 圖書結果也說明:需要补充说明的是,此处转换“NULL”值并不代表前面的ETL工作不到位,ETL 工作是检测数据的一致性、逻辑性、符合SQLSer-er性,就是说只要符合我们之前界定的输入Microsoft ...

國立臺灣大學 建築與城鄉研究所 黃麗玲所指導 董其樂的 資料驅動的智慧城市治理模式分析:以臺北大數據中心為例 (2021),提出etl是什麼關鍵因素是什麼,來自於智慧城市、數位轉型、資料治理、公私協力、資料協作、公民科技。

而第二篇論文輔仁大學 教育領導與發展研究所碩士在職專班 林偉人所指導 陳姿吟的 新北市國民中學雙語專長教師實施雙語教育之 現況、困境及因應策略 (2021),提出因為有 雙語專長教師、雙語教育的重點而找出了 etl是什麼的解答。

最後網站etl是什么 - 术之多則補充:(数据仓库技术). ETL,是英文Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、交互转换(transform)、加载 ...

接下來讓我們看這些論文和書籍都說些什麼吧:

除了etl是什麼,大家也想知道這些:

Pentaho Kettle解決方案:使用PDI構建開源ETL解決方案

A PHP Error was encountered

Severity: Warning

Message: file_put_contents(/var/www/html/prints/public/images/books_new/CN1/112/22/CN11122754.jpg): failed to open stream: Permission denied

Filename: helpers/global_helper.php

Line Number: 140

Backtrace:

File: /var/www/html/prints/application/helpers/global_helper.php
Line: 140
Function: file_put_contents

File: /var/www/html/prints/application/views/article_v2.php
Line: 144
Function: coverWebp_online

File: /var/www/html/prints/application/controllers/Pages.php
Line: 662
Function: view

File: /var/www/html/prints/public/index.php
Line: 319
Function: require_once

A PHP Error was encountered

Severity: Warning

Message: getimagesize(/var/www/html/prints/public/images/books_new/CN1/112/22/CN11122754.jpg): failed to open stream: No such file or directory

Filename: helpers/global_helper.php

Line Number: 62

Backtrace:

File: /var/www/html/prints/application/helpers/global_helper.php
Line: 62
Function: getimagesize

File: /var/www/html/prints/application/helpers/global_helper.php
Line: 142
Function: coverWebp

File: /var/www/html/prints/application/views/article_v2.php
Line: 144
Function: coverWebp_online

File: /var/www/html/prints/application/controllers/Pages.php
Line: 662
Function: view

File: /var/www/html/prints/public/index.php
Line: 319
Function: require_once

A PHP Error was encountered

Severity: Notice

Message: Trying to access array offset on value of type bool

Filename: helpers/global_helper.php

Line Number: 64

Backtrace:

File: /var/www/html/prints/application/helpers/global_helper.php
Line: 64
Function: _error_handler

File: /var/www/html/prints/application/helpers/global_helper.php
Line: 142
Function: coverWebp

File: /var/www/html/prints/application/views/article_v2.php
Line: 144
Function: coverWebp_online

File: /var/www/html/prints/application/controllers/Pages.php
Line: 662
Function: view

File: /var/www/html/prints/public/index.php
Line: 319
Function: require_once

A PHP Error was encountered

Severity: Notice

Message: Trying to access array offset on value of type bool

Filename: helpers/global_helper.php

Line Number: 66

Backtrace:

File: /var/www/html/prints/application/helpers/global_helper.php
Line: 66
Function: _error_handler

File: /var/www/html/prints/application/helpers/global_helper.php
Line: 142
Function: coverWebp

File: /var/www/html/prints/application/views/article_v2.php
Line: 144
Function: coverWebp_online

File: /var/www/html/prints/application/controllers/Pages.php
Line: 662
Function: view

File: /var/www/html/prints/public/index.php
Line: 319
Function: require_once

A PHP Error was encountered

Severity: Notice

Message: Trying to access array offset on value of type bool

Filename: helpers/global_helper.php

Line Number: 68

Backtrace:

File: /var/www/html/prints/application/helpers/global_helper.php
Line: 68
Function: _error_handler

File: /var/www/html/prints/application/helpers/global_helper.php
Line: 142
Function: coverWebp

File: /var/www/html/prints/application/views/article_v2.php
Line: 144
Function: coverWebp_online

File: /var/www/html/prints/application/controllers/Pages.php
Line: 662
Function: view

File: /var/www/html/prints/public/index.php
Line: 319
Function: require_once

為了解決etl是什麼的問題,作者(美)卡斯特 這樣論述:

本書主要介紹如何使用開源ETL工具來完成數據整合工作。本書介紹的PDI(Kettle)是一種開源的 ETL 解決方案,書中介紹了如何使用PDI來實現數據的剖析、清洗、校驗、抽取、轉換、加載等各類常見的ETL類工作。除了ODS/DW類比較大型的應用外,Kettle 實際還可以為中小企業提供靈活的數據抽取和數據處理的功能。Kettle除了支持各種關系型數據庫、HBase、MongoDB這樣的NoSQL數據源外,它還支持Excel、Access這類小型的數據源。並且通過插件擴展,Kettle 可以支持各類數據源。本書詳細介紹了Kettle可以處理的數據源,而且詳細介紹了如何使用Kettle抽取增量數

據。Kettle 的數據處理功能也很強大,除了選擇、過濾、分組、連接、排序這些常用的功能外,Kettle 里的Java表達式、正則表達式、Java腳本、Java類等功能都非常靈活而強大,都非常適合於各種數據處理功能。本書也使用了一些篇幅介紹Kettle這些靈活的數據處理功能。本書后面章節介紹了如何在 Kettle 上開發插件,如何使用Kettle處理實時數據流,以及如何在Amazon AWS上運行Kettle 等一些高級主題。除了介紹PDI(Kettle)工具的使用和功能,本書還結合Kimball博士的數據倉庫和ETL子系統的理論,從實踐的角度介紹數據倉庫的模型設計、數據倉庫的構建方法,以及如

何使用 PDI實現Kimball博士提出的34種ETL子系統。Matt Casters是一位具有多年工作經驗的獨立商業智能顧問。他為許多大公司建立了無數個數據倉庫和 BI解決方案。在過去的 8年里, Matt Casters把自己的時間都用於研發一個 ETL工具—— Kettle。2005年12月, Kettle成為開源軟件。 2006年初期, Kettle走進 Pentaho。隨后, Matt就職於 Pentaho,成為數據集成總監。在 Pentaho,他繼續從事 Kettle的研發工作。 Matt致力於幫助建設 Kettle社區,回答論壇上的提問,有時在世界會議上發表演講。Roland B

ouman目前從事前台頁面和商業智能的研發工作。他從 1998年開始從事 IT行業。多年來一直致力於開源軟件的研發,尤其是數據庫技術、商業智能以及頁面開發框架。同時, Roland Bouman還是 MySQL和Pentaho社區的成員。他經常參加 MySQL使用者會議、 OSCON、 Pentaho社區等國際會議。 Roland Bouman不僅是 MySQL 5.1 Cluster Certification Guide和Pentaho Solutions兩本書的合著者之一,也是 MySQL和Pentaho相關書籍的技術評論家。 第一部分:開始第1章 ETL入門21.1

OLTP和數據倉庫對比21.2 ETL是什麼31.2.1 ETL解決方案的演化過程41.2.2 ETL基本構成51.3 ETL、ELT和EII61.3.1 ELT61.3.2 EII:虛擬數據整合71.4 數據整合面臨的挑戰81.4.1 方法論:敏捷BI91.4.2 ETL設計101.4.3 獲取數據101.4.4 數據質量121.5 ETL工具的功能131.5.1 連接131.5.2 平台獨立141.5.3 數據規模141.5.4 設計靈活性141.5.5 復用性151.5.6 擴展性151.5.7 數據轉換151.5.8 測試和調試161.5.9 血統和影響分析161.5.10 日志和審

計161.6 小結17第2章 Kettle基本概念182.1 設計原則182.2 Kettle設計模塊192.2.1 轉換192.2.2 作業232.2.3 轉換或作業的元數據282.2.4 數據庫連接282.2.5 工具312.2.6 資源庫312.2.7 虛擬文件系統312.3 參數和變量322.3.1 定義變量322.3.2 命名參數332.3.3 使用變量332.4 可視化編程342.4.1 開始342.4.2 創建新的步驟352.4.3 放在一起362.5 小結38第3章 安裝和配置393.1 Kettle軟件概覽393.1.1 集成開發環境:Spoon403.1.2 命令行啟動:K

itchen和Pan423.1.3 作業服務器:Carte423.1.4 Encr.bat和encr.sh423.2 安裝433.2.1 Java環境433.2.2 安裝Kettle433.3 配置463.3.1 配置文件和kettle目錄463.3.2 用於啟動Kettle程序的shell腳本513.3.3 管理JDBC驅動523.4 小結53第4章 ETL示例解決方案——Sakila544.1 Sakila544.1.1 sakila示例數據庫554.1.2 租賃業務的星型模型574.2 預備知識和一些基礎的Spoon技巧604.2.1 安裝ETL解決方案604.2.2 Spoon使用60

4.3 ETL示例解決方案614.3.1 生成靜態維度624.3.2 循環加載644.4 小結80第二部分:ETL第5章 ETL子系統825.1 34種子系統介紹825.1.1 抽取835.1.2 清洗和更正數據845.1.3 數據發布865.1.4 管理ETL環境895.2 小結91第6章 數據抽取926.1 Kettle數據抽取概覽926.1.1 文件抽取936.1.2 數據庫抽取976.1.3 Web數據抽取986.1.4 基於流的和實時的抽取996.2 處理ERP和CRM系統1006.2.1 ERP挑戰1006.2.2 KettleERP插件1016.2.3 處理SAP數據1016.2

.4 ERP和CDC問題1046.3 數據剖析1056.4 CDC:變更數據捕獲1106.4.1 基於源數據的CDC1116.4.2 基於觸發器的CDC1136.4.3 基於快照的CDC1136.4.4 基於日志的CDC1166.4.5 哪個CDC方案更適合你1176.5 發布數據1176.6 小結118第7章 清洗和校驗1197.1 數據清洗1207.1.1 數據清洗步驟1217.1.2 使用參照表1237.1.3 數據校驗1277.2 錯誤處理1307.2.1 處理過程錯誤1317.2.2 轉換錯誤1327.2.3 處理數據(校驗)錯誤1337.3 審計數據和過程質量1367.4 數據排重

1377.4.1 去除完全重復的數據1377.4.2 不完全重復問題1387.4.3 設計排除重復記錄的轉換1397.5 腳本1427.5.1 公式1437.5.2 Java腳本1437.5.3 用戶自定義Java表達式1447.5.4 正則表達式1457.6 小結146第8章 處理維度表1478.1 管理各種鍵1488.1.1 管理業務鍵1488.1.2 生成代理鍵1498.2 加載維度表1548.2.1 雪花維度表1548.2.2 星型維度表1598.3 緩慢變更維度1618.3.1 緩慢變更維類型1618.3.2 類型1的緩慢變更維1618.3.3 類型2的緩慢變更維1638.3.4 其

他類型的緩慢變更維1678.4 更多維度1688.4.1 生成維(GeneratedDimensions)1688.4.2 雜項維度(JunkDimensions)1698.4.3 遞歸層次1708.5 小結171第9章 加載事實表1729.1 批量加載1739.1.1 STDIN和FIFO1739.1.2 Kettle批量加載1749.1.3 批量加載一般要考慮的問題1769.2 維度查詢1769.2.1 維護參照完整性1769.2.2 代理鍵管道1779.2.3 遲到數據1799.3 處理事實表1829.3.1 周期快照和累積快照1829.3.2 面向狀態的事實表1839.3.3 加載周期

快照表1859.3.4 加載累積快照表1859.3.5 加載面向狀態事實表1869.3.6 加載聚集表1869.4 小結187第10章 處理OLAP數據18810.1 OLAP的價值和挑戰18910.1.1 OLAP存儲類型19010.1.2 OLAP在系統中的位置19110.1.3 KettleOLAP選項19110.2 Mondrian19210.3 XML/A服務19410.4 Palo19710.4.1 建立Palo連接19810.4.2 Palo架構19910.4.3 讀Palo數據20010.4.4 寫Palo數據20210.5 小結204第三部分:管理和部署第11章 ETL開發生

命期20611.1 解決方案設計20611.1.1 好習慣和壞習慣20611.1.2 ETL流設計20911.1.3 可重用性和可維護性20911.2 敏捷開發21011.3 測試和調試21411.3.1 測試活動21411.3.2 ETL測試21511.3.3 調試21811.4 解決方案文檔化22011.4.1 為什麼實際情況下文檔很少22011.4.2 Kettle的文檔功能22111.4.3 生成文檔22211.5 小結223第12章 調度和監控22412.1 調度22412.1.1 操作系統級調度22512.1.2 使用Pentaho內置的調度程序22812.2 監控23212.2.

1 日志23212.2.2 郵件通知23412.3 小結237第13章 版本和移植23813.1 版本控制系統23813.1.1 基於文件的版本控制系統23913.1.2 內容管理系統24013.2 Kettle元數據24013.2.1 KettleXML元數據24113.2.2 Kettle資源庫元數據24213.3 管理資源庫24413.3.1 導出和導入資源庫24413.3.2 資源庫升級24513.4 版本移植系統24513.4.1 管理XML文件24513.4.2 管理資源庫24613.4.3 解決方案參數化24613.5 小結248第14章 血統和審計24914.1 批量血統抽取2

5014.2 血統25114.2.1 血統信息25114.2.2 影響分析信息25214.3 日志和操作元數據25414.3.1 日志基礎25414.3.2 日志架構25514.3.3 日志表25714.4 小結262第四部分:性能和擴展性第15章 性能調優26415.1 轉換性能:找到最弱連接26415.1.1 通過簡化找到性能瓶頸26515.1.2 通過度量值找到性能瓶頸26615.1.3 復制數據行26715.2 提高轉換性能26915.2.1 提高讀文本文件的性能26915.2.2 寫文本文件時使用延遲轉換27115.2.3 提高數據庫性能27215.2.4 數據排序27515.2.5

減少CPU消耗27615.3 提高作業性能28015.3.1 作業里的循環28015.3.2 數據庫連接池28115.4 小結281第16章 並行、集群和分區28316.1 多線程28316.1.1 數據行分發28416.1.2 記錄行合並28516.1.3 記錄行再分發28516.1.4 數據流水線28616.1.5 多線程的問題28716.1.6 作業中的並行執行28916.2 使用Carte子服務器28916.2.1 配置文件28916.2.2 定義子服務器29016.2.3 遠程執行29116.2.4 監視子服務器29116.2.5 Carte安全29116.2.6 服務29216.

3 集群轉換29316.3.1 定義一個集群模式29316.3.2 設計集群轉換29416.3.3 執行和監控29516.3.4 元數據轉換29616.4 分區29816.4.1 定義分區模式29916.4.2 分區的目標30016.4.3 實現分區30016.4.4 內部變量30116.4.5 數據庫分區30116.4.6 集群轉換中的分區30216.5 小結302第17章 雲計算中的動態集群30317.1 動態集群30317.1.1 建立動態集群30417.1.2 使用動態集群30617.2 雲計算30617.3 EC230717.3.1 如何使用EC230717.3.2 成本30717.

3.3 自定義AMI30717.3.4 打包新AMI31017.3.5 中止AMI31017.3.6 運行主節點31017.3.7 運行子節點31117.3.8 使用EC2集群31217.3.9 監控31317.3.10 輕量原則和持久性31417.4 小結314第18章 實時數據整合31518.1 實時ETL介紹31518.1.1 實時處理面臨的挑戰31618.1.2 需求31618.2 基於流的轉換31718.2.1 一個基於流的轉換實例31818.2.2 調試32118.2.3 第三方軟件和實時整合32118.2.4 Java消息服務32218.3 小結324第五部分:高級主題第19章

DataVault管理32619.1 DataVault模型介紹32719.2 你是否需要DataVault32719.3 DataVault的組成部分32819.3.1 中心表32819.3.2 鏈接表32919.3.3 附屬表32919.3.4 DataVault特點33119.3.5 構建DataVault模型33119.4 將Sakila的例子轉換成DataVault模型33119.4.1 Sakila中心表33119.4.2 Sakila鏈接表33219.4.3 Sakila附屬表33319.5 加載DataVault模型:簡單的ETL解決方案33419.5.1 安裝SakilaDa

taVault33519.5.2 安裝ETL方案33519.5.3 創建一個數據庫賬戶33519.5.4 ETL解決方案的例子33519.5.5 加載DataVault表34119.6 從DataVault模型更新數據集市34119.6.1 ETL解決方案例子34219.6.2 dim_actor轉換34219.6.3 dim_customer轉換34319.6.4 dim_film轉換34619.6.5 dim_film_actor_bridge轉換34719.6.6 fact_rental轉換34719.6.7 加載星型模型里的所有表34919.7 小結349第20章 處理復雜數據格式35

020.1 非關系型和非表格型的數據格式35020.2 非結構化的表格型數據35120.2.1 處理多值字段35120.2.2 處理重復的字段組35220.3 半結構化和非結構化數據35320.4 鍵/值對35820.5 小結362第21章 WebServices36321.1 Web頁面和WebServices36321.2 數據格式36521.2.1 XML36521.2.2 HTML36621.2.3 JavaScriptObjectNotation36721.3 XML例子36921.3.1 XML例子文件36921.3.2 從XML中抽取數據37121.3.3 生成XML文檔3782

1.4 SOAP例子38421.4.1 使用「Web服務查詢」步驟38521.4.2 直接訪問SOAP服務38621.5 JSON例子38921.5.1 Freebase項目38921.5.2 使用Kettle抽取Freebase數據39221.6 RSS39621.6.1 RSS結構39621.6.2 Kettle對RSS的支持39821.7 小結403第22章 Kettle集成40422.1 KettleAPI40422.1.1 LGPL協議40422.1.2 KettleJavaAPI40522.2 執行存在的轉換和作業40622.2.1 執行一個轉換40622.2.2 執行一個作業40

722.3 應用程序中嵌入Kettle40822.3.1 Pentaho報表40822.3.2 把數據放到轉換里41022.3.3 動態轉換41322.3.4 動態模板41622.3.5 動態作業41622.3.6 在Kettle里執行動態ETL41922.3.7 Result41922.3.8 替換元數據42022.4 OEM版本和二次發布版本42122.4.1 創建PDI的OEM版本42122.4.2 Kettle的二次發布(Forking)42222.5 小結423第23章 擴展Kettle42423.1 插件架構42423.1.1 插件類型42523.1.2 架構42523.1.3 前

提42523.2 轉換步驟插件42823.2.1 StepMetaInterface42823.2.2 StepDataInterface43423.2.3 StepDialogInterface43423.2.4 StepInterface44023.3 用戶自定義Java類步驟44423.3.1 傳遞元數據44423.3.2 訪問輸入和字段44523.3.3 代碼片段44523.3.4 例子44523.4 作業項插件44623.4.1 JobEntryInterface44623.4.2 JobEntryDialogInterface44823.5 分區插件44823.6 資源庫插件450

23.7 數據庫類型插件45023.8 小結451附錄A Kettle生態群452附錄B Kettle企業版特性456附錄C 內置的變量和屬性參考457

etl是什麼進入發燒排行的影片

AI-ready是什麼?大數據結合統計方法,得到真實證據,解決問題,精準管理。然而現在遭遇到最大的瓶頸,就是沒有標準,數據合併須要不斷重做。
以函數為起點,使用哪些函數、提升效率的寫法是什麼、變數函數應用。


00:00:00 開場
00:03:00 認識F檢定,獨立樣本T檢定
00:10:00 ETL與ELT的差別
00:20:00 F檢定:變異數差檢定
00:25:00 T檢定:平均數差檢定
00:30:00 F檢定:變異數差檢定
00:35:00 T檢定:平均數差檢定

資料驅動的智慧城市治理模式分析:以臺北大數據中心為例

為了解決etl是什麼的問題,作者董其樂 這樣論述:

近年來資通訊技術革命,智慧城市成為全球城市的政策發展重點。在技術變革、開放資料運動、公民科技文化等因素影響下,臺北市智慧城市的政策從產業驅動轉向資料驅動的治理模式,也形塑了一個由技術官僚、科技廠商、公民社群等多方利害關係人的動態協作網絡。本文探究官僚系統如何應對智慧城市治理挑戰、內部組織結構發生了何種轉化,以及各利害關係人又如何參與其中治理的過程。本研究以文本資料、田野觀察、深度訪談等質性研究方法,借用都市政權理論的分析視角,描繪臺北大數據中心這一技術與社會互相轉譯的建構現場,並詮釋臺北市智慧城市政策的演進。本研究認為,台北市的智慧城市發展中,為了增進官僚系統的創新能力,引入了由私部門主導的

公私協力模式,然而該取向仍面臨各局處的協作困境。而後官僚系統經調適,設立大數據中心作為新治理角色,引入數位社群IVC(In Visible Cities)作為行動者,推動各局處的資料流通,並以資料驅動專案回應都市議題的公眾行動,逐步轉化台北市智慧城市的治理取向。而IVC以分享會、讀書會,專案外包等多樣的公民科技形式,也展現了公民社群參與智慧城市治理之潛力。

新北市國民中學雙語專長教師實施雙語教育之 現況、困境及因應策略

為了解決etl是什麼的問題,作者陳姿吟 這樣論述:

本研究旨在瞭解新北市國中雙語專長教師實施雙語教育之現況、困境及因應策略。本研究採質性研究之半結構性訪談,邀請5位訪談對象—109學年度新北市國中教甄合格雙語專長教師,使用自編訪談大綱為研究工具,將蒐集到的資料加以分析歸納,最後提出以下結論:一、 雙語專長教師實施雙語教育之現況雙語專長教師積極追求專業成長,但未參與實體雙語共備社群;在教學方面,中英文比例依實際狀況有所不同,中文仍是最重要的溝通工具,而英文表現不列入學習成績評量;雙語專長教師採鼓勵正向之態度打造溫暖的雙語學習環境,然而大部分校園雙語學習氛圍薄弱;此外,各校行政主管對雙語教育的積極度與瞭解度有所差異,且學校行政對雙語專長教師提供協

助的情形有所差異。二、 雙語專長教師實施雙語教育時遭遇之困境研習資訊少且內容缺乏雙語實際教學經驗,加上學校工作繁忙及備課時間長影響教師追求專業成長;在教學方面,不少學生對於雙語課程接受度低且學習反應不佳;再者,雙語環境的營造缺乏學校支持,學校行政未協助各領域成立雙語共備社群且缺乏積極性,此外,受限於基本授課時數,雙語專長教師難以在全校發揮其影響性。三、 雙語專長教師在面對困境所採的因應策略透過多元管道以追求專業成長,並多方請益設計雙語教材,在教學方面,調整教學模式及作業方式,以提升學生學習動機與表現,不僅如此,善用周邊資源以營造雙語學習環境,且與行政端保持暢通溝通管道以尋求相關協助。依據上述結

果,針對教育主管機關、師培機構、學校行政單位及未來研究者提出建議。