第一章 第三節 數據流1.0

第一章 第三節 數據流1.0

作為藍科創公司數據分析師的劉鐵路工作還是比較輕鬆的,尤其是到了監控崗以後,有大量的既定方案去解決問題,哪個部分高了就去找誰解決問題,哪個部分不正常就找誰去處理,哪個設備故障了就找該設備的售後去維修。

就好比有個地方在問:1+1等於多少?幹活的人會寫出2。而劉鐵路的工作就是按下一個按鈕顯示出應該是2,然後再判斷用不用找人去驗證是不是2?

在這種工作節奏中準備一次分享還是綽綽有餘的。劉鐵路並不是很在意的準備了一下,數據流1.0的整個設計比較簡單,而複雜的是使用者如何去用。能夠在一次分享中把這個問題完整的展現出來就可以了。

周末的20點,在邏輯團的視頻會議頻道,參加人數為20人的《數據流1.0交流會》正式開始。

劉鐵路在寒暄之後說到:“各位朋友是不是有這樣一種體驗,去超市買東西的時候會顯得眼花繚亂?想買白砂糖,但是可供選擇的白砂糖種類太多,200g,賣3元的,500g,6元的,800g,9元的。買那種糖比較划算呢?”

“也許你會說500g比較划算。那是因為我列出來了。當然這還僅僅是糖,不容易壞的,如果是買水果呢?500g蘋果,5元。5000g蘋果,30元。你會說5000g划算,結果你一個人住就吃得下1000g,其餘的20元白扔了。”

“人們為了解決這種痛點設計出了一個詞:性價比。一個人喜歡玩電腦遊戲,4000元的電腦配置能玩市面上80%的遊戲,而8000元的電腦配置能玩100%的遊戲。你會覺得4000元的電腦配置很有性價比,但是有很多人覺得8000元能玩更多的遊戲才更有性價比。”

“人們的看法並不相同,但是他們需要一個得到關於性價比結論的機會。”

“簡單來說這就是數據流1.0的作用,從各種各樣的接口中讀取數據,從而在模塊的加持下,進行計算,輔助做出決策的工具。”

這時劉鐵路暫停了下來。網名叫拉齊的人說到:“感覺就是個比價工具沒什麼厲害的,還稱呼為數據流,有點名過其實吧。”

“不要急嘛。”說話的是紅龍,他顯得不緊不慢:“這才剛剛開始。我倒是覺得鐵網把一個概念講的那麼簡單,可見他是個把複雜問題簡單化的人。”

“謝謝支持啊。”劉鐵路的網名是鐵網,這段暫停是紅龍看了他的分享大綱之後跟他商量的。一開始他並沒問為什麼?現在看來就是紅龍為了顯擺自己而增加的額外項目。

“在投資圈有句名言:如果不明白什麼因素在操縱市場,那麼就不應該下場。前面所講的是數據流1.0的理念和願景,而後面則是它如同流水一般自由的分析方法。”劉鐵路的講解由淺至深,整體簡潔輕快。

“當前數據流有兩大模塊,後續還可以增加。第一大模塊:時間、空間模塊。以時間或者空間為主軸把數據排開進行分析。”接下來劉鐵路展示了幾張,看起來很平庸的PPT,均是數據得出的歷史數據。其中包括:Z國人口情況,M國人口情況,各個主要國家經濟發展情況,重要投資品歷史價格關係。

“結論顯得稀鬆平常是吧?各位會友。就像1+1在什麼時間中是等於2一樣,稀鬆平常,不值一提。簡單的問題有簡單的結論,複雜的問題可以經過轉化之後變得簡單,從而得出結論。第一個模塊就是用來得出簡單結論的。”

“第二個模塊,關係型模塊。顧名思義,是分析相關因素之間關係的模塊。在數據分析中一個事物和另一個事物完全正相關,那麼這個關係會被計算出來是1,反之則是-1,完全不相關則為0。數學在這裏很純粹,1+1跟=2的關係肯定是1啊。1+1和這個角是鈍角的關係肯定是0啊。數學就是那麼純粹。”

劉鐵路自認為幽默的話語,讓他在哪裏尬笑了半分鐘,空氣中充滿了尷尬的氣氛。願意參會的人其實都是對新知識有興趣的人,正要聽聽數據流其中的門道,完美沒有跟上劉鐵路尬笑的步伐。

“從數學的例子也可以看到,數據分析是更加複雜的,他並不是一個完全的數學遊戲。一開始有個學派認為數據就是最純粹的比大小,只要按照比大小來操作就能解決所有的問題。但是他們錯了,就好比60%一定比40%大。”

“人們都知道40比60要小,但是在一個場景中一個富翁花了40%的錢就是比一個乞丐花了60%的錢多。也許你覺得這還是數字遊戲。那麼,一個人願意為一件他憎惡的事情花費60%和一個人願意為一件他喜歡的事情花費40%的意義不一樣的。一個深惡痛絕的表示自己不會再花錢了,簡直是災難。一個則表示花的每一分錢都是享受。他們後續消費的意願不同,但是你只看到數據會覺得60%的人會再花錢。甚至於前者是買安眠藥自殺。”

“友友們,數據要反應出真實的世界是非常難的,因為它需要足夠“乾淨”的數據,並且還要貼近現實,或者說叫做貼近業務。數據流1.0中的關係模塊就是為了這個而誕生。”

“富翁的錢數和花錢數有比值,富翁的錢數,定義為富翁人群的個數,富翁的花錢數,花錢在哪個地方,這些全都有記錄。當然,窮人也有。第二個案例中,每個人花錢的地方,花錢的頻率,花錢的時間,花錢的錢數,花錢的大小額度,用數據流1.0都能把他們進行分類,貼上標籤,從而進行下一步的操作。如何更加便利的服務他們。”

“明白,從他們手裏撈錢。這樣會不會侵犯私隱啊?”一個叫毛歌的賬號發出了一條彈幕。

“我們收集的是他們的交互信息,不收集個人具體信息,甚至於我們不知道他們誰是誰,我們只知道他們身份的編碼。當然,讓技術回歸技術吧。這些業務上的事不重要,重要的是數據流1.0的功能,他可以把更多的數據進行比較,更自由,更互通。”

“有意思,能演示一下嗎?”拉齊問道。

“好,我們換個例子。假如我這裏有w市10年內50000名中學生的初中數學成績。過去的處理方法是什麼?我們給這些學生排個隊,弄個狀元,榜眼什麼的。然後讓這些人去告訴那些考試差的人:交錢我就告訴你,你沒考上清華的秘密。人家交錢了,他們說了一堆,最後的結論就是:少做兩道題,你的分數不到外國大學,就到清華了。這種茶言茶語嗎?”

“真是黑心商人啊。”一條彈幕飛過。

“對,我也覺得是,所以現在都叫‘賦能’了。我們把50000份數據分析,每一個人都錯在哪裏?不要急於得出結論,因為數據流要清理出臟數據。數據流1.0會把處理數據的方法一個個羅列出來,就像一個個模具一樣。按照題目類型分類:選擇題,多選題,判斷題,填空題,解答題。按照題目類型分類:考察的相關知識點。考生出錯的方式:理念錯誤,計算錯誤,馬虎大意。”

“你看到的不再是一個個考生的試捲紙,而是每個考生在數學學習中如同棋局一般的行進路線。”

“我聽說過你這個觀點。這是用一種監測的方式來教育問題。考試就是監測,而分數就是監測點,值得關注的是監測點而不是監測。”毛歌在語音中脫口而出。

“嗯,你抓住重點了。把所有的人數據分析完,我們就給出每一個人最合理的學習建議。包括:需要重新學習那個知識點、增加相關考試技巧,你當前處境的深層原因,跟你一樣處於過當前危機狀況的人數,甚至於其他人是如何逃離這些問題的。你的學習軌跡清晰可見,你還學不好或者學的慢,那就是沒有天賦了。”

“收尾了。一個能從各種各樣接口流入數據,並分析大量關聯性數據的工具就是數據流1.0。希望我的分享對大家有用。有機會給大家繼續演示數據流1.0是如何調整數據以應對各種各樣的統計問題的。”

視頻會議中的人們反應不是很熱烈,都是一臉懵,估計更多的是挺有趣,但是也就這樣吧。

劉鐵路對於現狀倒是很滿意,只是花了20分鐘,稍稍講了數據流1.0的理念,具體如何操作和其中正在開發的糾錯功能沒有講,不引人注意的過去就好,這也符合邏輯團這個哲學群組的風格了。

紅龍發來了一條短訊:鐵網兄弟,你的這個東西我很感興趣,可以有機會面聊一下嗎?我帶你參觀個地方,保證你覺得有趣。

劉鐵路打着哈哈:不會是去咱們這個歲數應該去的場所吧。另外,我可沒錢啊,錢都上交給老婆了。(其實,並沒有。只是劉鐵路這人極其自律,討厭大手大腳。)

“放心,不是咱們這個歲數應該去和不應該去的場所。對於這個場所我的描述是:一個人盡其才的地方。今天的分享讓你有了去的資格,去不去隨你,如果有需要就聯繫我。”

“好,有機會見一面吧,我再決定是不是去。”劉鐵路對紅龍的印象不錯,論談吐紅龍是同類人,但是涉及太深就有點唐突了,這幫不得志的同類人中也是經歷廣泛之輩,路子可能比較野。

上一章書籍頁下一章

決鬥筆記

···
加入書架
上一章
首頁 科幻靈異 決鬥筆記
上一章下一章

第一章 第三節 數據流1.0

%