国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一位大數(shù)據(jù)開發(fā)工程師的兩年工作經(jīng)驗總結

工程師人生 ? 來源:網(wǎng)絡整理 ? 作者:工程師吳畏 ? 2018-07-02 16:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今年廣州的六月,在經(jīng)歷了大雨的洗禮之后,一切都變得更加明朗起來,新的工作,新的人和事。懶惰讓我變得更焦慮,焦慮促使我進步,程序員的焦慮大家應該都有共同的感覺,時代的步伐太快了,在這個環(huán)境下的軟件開發(fā)一定會淘汰掉那些不懂得學習,懶惰的人。

希望跟大家共勉。

今天呢,博主主要回顧這兩年來,在大數(shù)據(jù)行業(yè)公司從事大數(shù)據(jù)類的前端開發(fā)的工作。最近剛剛換了一份工作,把我的經(jīng)驗稍作總結分享給大家,有什么建議大家在評論區(qū)踴躍。 謝謝。

今天的主題,主要是從大數(shù)據(jù)開發(fā)的角度,到大數(shù)據(jù)治理的必要性,再到圖形化建模的暢想,最后在數(shù)據(jù)質量的把關,然后到大數(shù)據(jù)可視化的應用,博主總結兩年的見聞,和我學習的成果,也不知理解有無偏差吧,希望大家能給出建議。

大數(shù)據(jù)開發(fā)

大數(shù)據(jù)開發(fā),有幾個階段:

1.數(shù)據(jù)采集【原始數(shù)據(jù)】

2.數(shù)據(jù)匯聚【經(jīng)過清洗合并的可用數(shù)據(jù)】

3.數(shù)據(jù)轉換和映射【經(jīng)過分類,提取的專項主題數(shù)據(jù)】

4.數(shù)據(jù)應用 【提供api 智能系統(tǒng) 應用系統(tǒng)等】

數(shù)據(jù)采集

數(shù)據(jù)采集有線上和線下兩種方式,線上一般通過爬蟲、通過抓取,或者通過已有應用系統(tǒng)的采集,在這個階段,我們可以做一個大數(shù)據(jù)采集平臺,依托自動爬蟲(使用python或者nodejs制作爬蟲軟件),ETL工具、或者自定義的抽取轉換引擎,從文件中、數(shù)據(jù)庫中、網(wǎng)頁中專項爬取數(shù)據(jù),如果這一步通過自動化系統(tǒng)來做的話,可以很方便的管理所有的原始數(shù)據(jù),并且從數(shù)據(jù)的開始對數(shù)據(jù)進行標簽采集,可以規(guī)范開發(fā)人員的工作。并且目標數(shù)據(jù)源可以更方便的管理。

數(shù)據(jù)采集的難點在于多數(shù)據(jù)源,例如mysql、postgresql、sqlserver 、 mongodb 、sqllite。還有本地文件、excel統(tǒng)計文檔、甚至是doc文件。如何將他們規(guī)整的、有方案的整理進我們的大數(shù)據(jù)流程中也是必不可缺的一環(huán)。

數(shù)據(jù)匯聚

數(shù)據(jù)的匯聚是大數(shù)據(jù)流程最關鍵的一步,你可以在這里加上數(shù)據(jù)標準化,你也可以在這里做數(shù)據(jù)清洗,數(shù)據(jù)合并,還可以在這一步將數(shù)據(jù)存檔,將確認可用的數(shù)據(jù)經(jīng)過可監(jiān)控的流程進行整理歸類,這里產(chǎn)出的所有數(shù)據(jù)就是整個公司的數(shù)據(jù)資產(chǎn)了,到了一定的量就是一筆固定資產(chǎn)。

數(shù)據(jù)匯聚的難點在于如何標準化數(shù)據(jù),例如表名標準化,表的標簽分類,表的用途,數(shù)據(jù)的量,是否有數(shù)據(jù)增量?,數(shù)據(jù)是否可用? 需要在業(yè)務上下很大的功夫,必要時還要引入智能化處理,例如根據(jù)內容訓練結果自動打標簽,自動分配推薦表名、表字段名等。還有如何從原始數(shù)據(jù)中導入數(shù)據(jù)等。

數(shù)據(jù)轉換和映射

經(jīng)過數(shù)據(jù)匯聚的數(shù)據(jù)資產(chǎn)如何提供給具體的使用方使用?在這一步,主要就是考慮數(shù)據(jù)如何應用,如何將兩個?三個?數(shù)據(jù)表轉換成一張能夠提供服務的數(shù)據(jù)。然后定期更新增量。

經(jīng)過前面的那幾步,在這一步難點并不太多了,如何轉換數(shù)據(jù)與如何清洗數(shù)據(jù)、標準數(shù)據(jù)無二,將兩個字段的值轉換成一個字段,或者根據(jù)多個可用表統(tǒng)計出一張圖表數(shù)據(jù)等等。

數(shù)據(jù)應用

數(shù)據(jù)的應用方式很多,有對外的、有對內的,如果擁有了前期的大量數(shù)據(jù)資產(chǎn),通過restful API提供給用戶?或者提供流式引擎 KAFKA 給應用消費? 或者直接組成專題數(shù)據(jù),供自己的應用查詢?這里對數(shù)據(jù)資產(chǎn)的要求比較高,所以前期的工作做好了,這里的自由度很高。

總結:大數(shù)據(jù)開發(fā)的難點

大數(shù)據(jù)開發(fā)的難點主要是監(jiān)控,怎么樣規(guī)劃開發(fā)人員的工作?開發(fā)人員隨隨便便采集了一堆垃圾數(shù)據(jù),并且直連數(shù)據(jù)庫。 短期來看,這些問題比較小,可以矯正。 但是在資產(chǎn)的量不斷增加的時候,這就是一顆定時炸彈,隨時會引爆,然后引發(fā)一系列對數(shù)據(jù)資產(chǎn)的影響,例如數(shù)據(jù)混亂帶來的就是數(shù)據(jù)資產(chǎn)的價值下降,客戶信任度變低。

如何監(jiān)控開發(fā)人員的開發(fā)流程?

答案只能是自動化平臺,只有自動化平臺能夠做到讓開發(fā)人員感到舒心的同時,接受新的事務,拋棄手動時代。

這就是前端開發(fā)工程師在大數(shù)據(jù)行業(yè)中所占有的優(yōu)勢點,如何制作交互良好的可視化操作界面?如何將現(xiàn)有的工作流程、工作需求變成一個個的可視化操作界面? 可不可以使用智能化取代一些無腦的操作?

從一定意義上來說,大數(shù)據(jù)開發(fā)中,我個人認為前端開發(fā)工程師占據(jù)著更重要的位置,僅次于大數(shù)據(jù)開發(fā)工程師。至于后臺開發(fā),系統(tǒng)開發(fā)是第三位的。好的交互至關重要,如何轉換數(shù)據(jù),如何抽取數(shù)據(jù),一定程度上,都是有先人踩過的坑,例如kettle,再例如kafka,pipeline ,解決方案眾多。關鍵是如何交互? 怎么樣變現(xiàn)為可視化界面? 這是一個重要的課題。

現(xiàn)有的各位朋友的側重點不同,認為前端的角色都是可有可無,我覺得是錯誤的,后臺的確很重要,但是后臺的解決方案多。 前端實際的地位更重要,但是基本無開源的解決方案,如果不夠重視前端開發(fā), 面臨的問題就是交互很爛,界面爛,體驗差,導致開發(fā)人員的排斥,而可視化這塊的知識點眾多,對開發(fā)人員的素質要求更高。

大數(shù)據(jù)治理

大數(shù)據(jù)治理應該貫穿整個大數(shù)據(jù)開發(fā)流程,它有扮演著重要的角色,淺略的介紹幾點:

數(shù)據(jù)血緣

數(shù)據(jù)質量審查

全平臺監(jiān)控

數(shù)據(jù)血緣

從數(shù)據(jù)血緣說起,數(shù)據(jù)血緣應該是大數(shù)據(jù)治理的入口,通過一張表,能夠清晰看見它的來龍去脈,字段的拆分,清洗過程,表的流轉,數(shù)據(jù)的量的變化,都應該從數(shù)據(jù)血緣出發(fā),我個人認為,大數(shù)據(jù)治理整個的目標就是這個數(shù)據(jù)血緣,從數(shù)據(jù)血緣能夠有監(jiān)控全局的能力。

數(shù)據(jù)血緣是依托于大數(shù)據(jù)開發(fā)過程的,它包圍著整個大數(shù)據(jù)開發(fā)過程,每一步開發(fā)的歷史,數(shù)據(jù)導入的歷史,都應該有相應的記錄,數(shù)據(jù)血緣在數(shù)據(jù)資產(chǎn)有一定規(guī)模時,基本必不可少。

數(shù)據(jù)質量審查

數(shù)據(jù)開發(fā)中,每一個模型(表)創(chuàng)建的結束,都應該有一個數(shù)據(jù)質量審查的過程,在體系大的環(huán)境中,還應該在關鍵步驟添加審批,例如在數(shù)據(jù)轉換和映射這一步,涉及到客戶的數(shù)據(jù)提供,應該建立一個完善的數(shù)據(jù)質量審查制度,幫助企業(yè)第一時間發(fā)現(xiàn)數(shù)據(jù)存在的問題,在數(shù)據(jù)發(fā)生問題時也能第一時間看到問題的所在,并從根源解決問題,而不是盲目的通過連接數(shù)據(jù)庫一遍一遍的查詢sql。

全平臺監(jiān)控

監(jiān)控呢,其實包含了很多的點,例如應用監(jiān)控,數(shù)據(jù)監(jiān)控,預警系統(tǒng),工單系統(tǒng)等,對我們接管的每個數(shù)據(jù)源、數(shù)據(jù)表都需要做到實時監(jiān)控,一旦發(fā)生殆機,或者發(fā)生停電,能夠第一時間電話或者短信通知到具體負責人,這里可以借鑒一些自動化運維平臺的經(jīng)驗的,監(jiān)控約等于運維,好的監(jiān)控提供的數(shù)據(jù)資產(chǎn)的保護也是很重要的。

大數(shù)據(jù)可視化

大數(shù)據(jù)可視化不僅僅是圖表的展現(xiàn),大數(shù)據(jù)可視化不僅僅是圖表的展現(xiàn),大數(shù)據(jù)可視化不僅僅是圖表的展現(xiàn),重要的事說三遍,大數(shù)據(jù)可視化歸類的數(shù)據(jù)開發(fā)中,有一部分屬于應用類,有一部分屬于開發(fā)類。

在開發(fā)中,大數(shù)據(jù)可視化扮演的是可視化操作的角色, 如何通過可視化的模式建立模型? 如何通過拖拉拽,或者立體操作來實現(xiàn)數(shù)據(jù)質量的可操作性? 畫兩個表格加幾個按鈕實現(xiàn)復雜的操作流程是不現(xiàn)實的。

在可視化應用中,更多的也有如何轉換數(shù)據(jù),如何展示數(shù)據(jù),圖表是其中的一部分,平時更多的工作還是對數(shù)據(jù)的分析,怎么樣更直觀的表達數(shù)據(jù)?這需要對數(shù)據(jù)有深刻的理解,對業(yè)務有深刻的理解,才能做出合適的可視化應用。

智能的可視化平臺

可視化是可以被再可視化的,例如superset,通過操作sql實現(xiàn)圖表,有一些產(chǎn)品甚至能做到根據(jù)數(shù)據(jù)的內容智能分類,推薦圖表類型,實時的進行可視化開發(fā),這樣的功能才是可視化現(xiàn)有的發(fā)展方向,我們需要大量的可視化內容來對公司發(fā)生產(chǎn)出,例如服裝行業(yè),銷售部門:進貨出貨,顏色搭配對用戶的影響,季節(jié)對選擇的影響 生產(chǎn)部門:布料價格走勢? 產(chǎn)能和效率的數(shù)據(jù)統(tǒng)計? 等等,每一個部門都可以有一個數(shù)據(jù)大屏,可以通過平臺任意規(guī)劃自己的大屏,所有人每天能夠關注到自己的領域動向,這才是大數(shù)據(jù)可視化應用的具體意義。

寫在最后

洋洋灑灑寫了很多,對我近兩年的所見所聞所學所想進行了一些總結,有些童鞋會問,不是技術么?為什么沒有代碼? 博主要說,代碼博主要學的,要寫的,但是與工作無關,代碼是我個人的技能,個人傍身,實現(xiàn)個人想法的重要技能。 但是,代碼與業(yè)務的關系不大,在工作中,懂業(yè)務的人代碼寫的更好,因為他知道公司想要什么。如果你業(yè)務很差,那也沒關系,你代碼好就行了呀,根據(jù)別人的交代干活,也是很不錯的。技術和業(yè)務是相輔相成的,稍后博主總結代碼的精進。

寫完了,博主的焦慮一絲未少,我的代碼規(guī)范性不夠,目前技術棧js、java、nodejs、python 。

主業(yè)js熟練度80%吧,正在研究阮一峰的es6(看的差不多)和vuejs的源碼(有點擱淺),vuejs算是中等,css和布局方面可以說還可以,另外d3.js,go.js都是處于會用,能干活。 nodejs呢,express和koa無問題,看過一些express的源代碼,還寫過兩個中間件。

java、python都處于能做項目的程度,目前也不想抽很多精力去深入它們,就想要保持在想用能用的地步吧。

未來的幾年,博主努力工作,多學學人工智能、大數(shù)據(jù)開發(fā)的知識,未來這塊應該還有一些熱度的吧。

最后,和大家共勉,更希望大家能給一些規(guī)劃建議,三人行,必有我?guī)熝伞?/p>

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 工程師
    +關注

    關注

    59

    文章

    1603

    瀏覽量

    71034
  • 大數(shù)據(jù)

    關注

    64

    文章

    9063

    瀏覽量

    143761
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    電子工程師設計要點與經(jīng)驗分享

    電子工程師設計要點與經(jīng)驗分享 作為名資深電子工程師,在硬件設計開發(fā)領域摸爬滾打多年,積累了不少寶貴的經(jīng)
    的頭像 發(fā)表于 02-03 11:10 ?181次閱讀

    什么是BSP工程師

    任何軟件的。BSP工程師需要結合硬件原理圖修改從芯片廠商拿到的參考代碼,調試板子,使板子上的操作系統(tǒng)能夠正常穩(wěn)定工作,從而提供個穩(wěn)定的開發(fā)調試環(huán)境,這個過程叫做點亮板子,行話叫做Br
    發(fā)表于 01-13 06:54

    電子工程師設計要點與經(jīng)驗分享

    電子工程師設計要點與經(jīng)驗分享 作為名資深電子工程師,在多年的硬件設計開發(fā)工作中,積累了不少寶貴
    的頭像 發(fā)表于 01-07 13:55 ?294次閱讀

    繡花線上的數(shù)據(jù)紐帶:一位工程師的PROFIBUS轉RS485改造手記

    繡花線上的數(shù)據(jù)紐帶:一位工程師的PROFIBUS轉RS485改造手記 1. 工廠背景:老設備遇上新系統(tǒng) 我們廠位于江浙紡織產(chǎn)業(yè)帶,主要生產(chǎn)高檔繡花面料。三前,公司引入了
    的頭像 發(fā)表于 12-25 14:23 ?212次閱讀
    繡花線上的<b class='flag-5'>數(shù)據(jù)</b>紐帶:<b class='flag-5'>一位</b><b class='flag-5'>工程師</b>的PROFIBUS轉RS485改造手記

    招鑲入式工程師1個,硬件工程師個,

    東莞市研生科技有限公司是家藍牙方案公司,主營藍牙方案的設計開發(fā),產(chǎn)品包括藍牙BLE/4G透傳/AI智能體方案開發(fā),因公司發(fā)展需要需對外招聘嵌入式軟件開發(fā)
    發(fā)表于 08-29 02:14

    電子發(fā)燒友工程師看!電子領域評職稱,技術之路更扎實

    。比如一位電源工程師,評職稱前主要做基礎電源調試;評上 “高級電源工程師” 后,受邀參與電子發(fā)燒友 “電源技術研討會” 做分享,還接到廠商委托的高功率密度電源開發(fā)項目,項目成果被平臺推
    發(fā)表于 08-20 13:53

    華為工程師總結Linux筆記

    種使用 GNU 通用公共許可證(GNU GeneralPublic License,GPL)工程各種工具和數(shù)據(jù)庫的操作系統(tǒng)。 GNU 是“GNU is Not Unix”,UNIX 是種廣泛使用的商業(yè)
    發(fā)表于 07-14 15:28

    工程師分享的模電設計經(jīng)驗

    模擬電路的設計是工程師們最頭疼,但也是最致命的設計部分。盡管目前數(shù)字電路、大規(guī)模集成電路的發(fā)展非常迅猛,但是模擬電路的設計仍是不可避免的,有時也是數(shù)字電路無法取代的,例如RF射頻電路的設計。 本文總結了模擬電路設計中應該注意的問題。
    的頭像 發(fā)表于 05-29 09:38 ?645次閱讀

    【華秋DFM】V4.6正式上線:工程師的PCB設計“好搭子”來了!

    裝配圖中,號和型號信息對于元件的安裝和調試至關重要。通過雙色標注,工程師可以更加清晰地區(qū)分和查看這個重要信息,避免了因顏色單、信息混淆而導致的核對錯誤。在生產(chǎn)現(xiàn)場,
    發(fā)表于 05-22 16:07

    如何成為名合格的KaihongOS北向應用開發(fā)工程師

    如何成為名合格的北向應用開發(fā)工程師 在快速發(fā)展的軟件開發(fā)領域,北向應用開發(fā)工程師
    發(fā)表于 04-23 06:46

    如何成為名嵌入式軟件工程師

    軟件工程師保持持續(xù)學習的態(tài)度,緊跟技術發(fā)展趨勢;同時,注重實踐經(jīng)驗的積累,積極參與實際項目的開發(fā)和調試工作。 此外,還應不斷提升自己的溝通能力和團隊協(xié)作能力,以適應日益復雜的
    發(fā)表于 04-15 14:37

    招拿捏電子工程師#被AI拿捏了 #電子工程師 #電子電工

    電子工程師
    安泰小課堂
    發(fā)布于 :2025年03月25日 17:30:51

    一位老電子工程師的十職場感悟

    這里主要以個人經(jīng)歷談談電子工程師技術生涯可能面臨的困惑、關心的問題以及對未來的期待。Chrent新手感興趣的問題1、電子工程師矛盾心態(tài)——電子新手新沒事做,沒人教,工作沒有技術含量?電子新手往往
    的頭像 發(fā)表于 03-19 17:32 ?893次閱讀
    <b class='flag-5'>一位</b>老電子<b class='flag-5'>工程師</b>的十<b class='flag-5'>年</b>職場感悟

    GaN E-HEMTs的PCB布局經(jīng)驗總結

    GaN E-HEMTs的PCB布局經(jīng)驗總結
    的頭像 發(fā)表于 03-13 15:52 ?1349次閱讀
    GaN E-HEMTs的PCB布局<b class='flag-5'>經(jīng)驗總結</b>