學會數據分析職場收益長久,越老越吃香,受其他外部業務影響相對較小,職位相對穩定。
大部分行業都會應用到數據分析,互聯網銀行、零售、醫藥業、制 造業、交通等等。
01華信智原大數據分析專業體系
運算符與表達式、垃圾回收機制、函數式編程、類和對象、Git操作
Python內存管理、引用計數、函數式編程定義、高階函數、遞歸、學生信息錄入、刪除、修改、成績排序、存儲等功能
網絡爬蟲基礎、Scrapy框架、Linux & 數據庫基礎
Mysql高級查詢、單表、多表、子查詢、分頁、聯表、視圖、函數、觸發器、索引、優化;pipeline的介logging模塊的使用、構造請求、item的介紹使用、debug信息的認識、scrapy shell、scrapy settings存儲過程、事務
Excel數據分析、數據分析工具Numpy、數據分析工具Pandas、數據可視化工具matplotlib
ndarray對象、索引和切片、組合與拆分、數據類型、Pandas定義、Pandas功能、Pandas的安裝、Tableau圖表分析、Tableau地圖繪制與 圖像、Tableau高級圖表類型
Scikit-Learn機器學習、深度學習
掌握機器學習常用回歸、分類以及聚類算法原理及API使用;掌握機器學習算法超參數優選方法,并訓練模型;掌握深度學習框架Tensorflow的原理及常用API的使用;掌握神經網絡的特點及原理;在數據分析師的基礎之上進一步增加核心競爭力;邁進數據挖掘和人工智能大門,掌握必備的入門條件
02理論+實踐 由淺入深逐級構建開發能力
03行業大咖教學團隊,讓你所學即所用
開發了RainBoSoft監管系統、車管所車輛信息監管系統、某公司電子商務系統、北京市稅務局稅務申報系統、智能室內設計系統、智能駕駛系統、票務智能檢票系統
通俗易懂,能夠使用淺顯的道理比喻、解決問題
參與多項教育、銀行、企業的OA系統開發
有豐富的經驗,通過啟發式教學,讓學生更好接受知識點
04產學結合的項目化教學
基于Python數據分析工具Numpy、Pandas對多支股票進行各項指標分析,包括股票k線圖、移動平均線、布林帶、股票波動、股票相關性分析、股票趨勢性分析、股票交易風險評估。利用Sciki-Learn機器學習建立模型,進行股票價格預測、股票交易策略模擬、股票交易時機分析。利用數據可視化工具matplotlib、seabron對結果予以圖形化展示
Numpy、Pandas、機器學習、matplotlib、seabron
使用Scrapy框架爬取各大網站房屋數據,利用Python數據分析工具分析各城市房屋均價、房屋總價、房價走勢、房源數量、房屋面積分布、樓層、裝修等。利用機器學習建立模型,對房價影響因素進行深度揭秘、并對房屋價格進行預測。
Python爬蟲、Numpy、Pandas、機器學習、可視化工具matplotlib、seabron、pyecharts
收集用戶基本信息、用戶交易信息,構建用戶畫像。構建模型并進行訓練,基于K-Means算法對用戶進行聚類分析,用戶相似度分析,基于用戶相似度進行商品推薦,對不同用戶實現精準營銷。
大型門戶網站和大型婚戀網站積累了海量信息,提取有用的價值,應用于數據挖掘、海量數據分析、市場分析(包括熱點資訊、關鍵詞點擊、輿情分析、全國婚戀市場、個人信息分析等情況),掌握爬蟲技術顯得尤為重要。
1、Python 多線程爬蟲及其機制
2、使用Python、requests等網絡模塊
3、使用Python lxml、BeautifulSoup、re、json模塊進行數據提取
4、XPath語法規則和各CSS Selector的使用
5、使用Selenium+Chrome實施動態HTML抓取
6、掌握Scrapy框架,以及編寫各類中間件
7、掌握scrapy-redis分布式框架,了解各組件工作機制
使用Lambda架構整合實時計算和離線計算,借助分布式環境提升計算能力;使用Flume收集用戶的點擊、瀏覽、收藏等行為,建立用戶畫像和文章畫像,并存儲于HDFS集群;通過離線Spark SQL計算建立HIVE特征中心,存儲到HBase集群;通過ALS、LR、Wide&Deep等機器學習與深度學習、推薦算法進行智能推薦,達到千人千面的用戶推薦效果。
1、ABTest實驗平臺
2、用戶反饋收集
3、實時計算平臺
4、離線計算分析平臺