用户 | 找書
火爆小説網址:fubi520.cc

數焰更新5章全集TXT下載/免費在線下載/星越蔓蔓

時間:2026-04-07 23:31 /原創小説 / 編輯:蕭景琰
主角是未知的小説是《數焰》,本小説的作者是星越蔓蔓最新寫的一本近代近代現代、多元、短篇類小説,書中主要講述了:如果你的人生數據付從正太分佈,説明你是個普通...

數焰

作品主角:未知

連載情況: 連載中

《數焰》在線閲讀

《數焰》第1部分

如果你的人生數據從正分佈,説明你是個普通人,沒什麼不好的。

陸明遠已經在這堆東西面坐了三個小時。

嚴格來説,這不是一堆東西,這是一個人——林墨,他的妻子,去世一百天的妻子——留在這個世界上最的物質形。統計局宿舍樓五十七平米的老子裏,到處都是她的痕跡,但陸明遠從不覺得那是痕跡,他管它們“數據”。

數據需要清洗,這是他的職業本能。

作為國家統計局城市社會經濟調查司的主任科員,陸明遠在過去十五年裏處理過的數據表格如果打印出來,能把他們的卧室從地板堆到天花板。他知什麼樣的數據是有效的,什麼樣的數據是噪音,什麼樣的數據該被毫不猶豫地剔除。

所以他今天要做的事,聽起來很殘忍,但從專業角度來説非常理:清理林墨留下的遺物,剔除噪音,留下有效樣本。

茶几上堆着三大箱東西,全是林墨的。溢付、書、筆記本、零散的票據、幾張銀行卡、一個用了五年的手機、一瓶用到一半的護手霜。陸明遠給自己倒了杯,坐在沙發上,開始分類。

溢付:有效數據,捐給小區門的回收箱。

票據:噪音,直接扔掉。

筆記本:需要一步判斷。

手機:需要一步判斷。

護手霜:……

他拿起那支護手霜,擰開蓋子聞了聞,是茉莉花的味。林墨喜歡茉莉花,每年夏天都要從菜市場買一小盆,放在陽台上。開花的時候,整個屋子都是的。來那盆花了,林墨難過了好幾天。陸明遠當時正在趕一個關於居民消費價格的報告,沒太在意。

護手霜應該屬於什麼?有效數據還是噪音?

他把蓋子擰回去,放在茶几的一角。暫時擱置。

筆記本一共七本,都是那種最普通的牛皮紙封面的工作筆記本,單位發的。林墨生在國家發改委宏觀經濟研究院工作,比他高兩級,工資比他多兩千三——他精確地記得這個數字,因為每次吵架的時候林墨從來不説,但他自己會在心裏算。

翻開第一本,全是工作筆記。某年某月某,某次會議,某人發言,某組數據。陸明遠的職業病犯了,開始速掃描,尋找異常值。沒有。全是規規矩矩的會議記錄,字跡工整得像印刷。第二本,一樣。第三本,一樣。一直到第七本,都一樣。

七本筆記本,七百多頁,全是工作。

陸明遠放下筆記本,突然覺得有點不上氣。不是悲傷,是一種説不清的受,像被什麼東西卡住了。七百多頁,全是工作。他們的婚姻十五年,她留下的文字記錄七百多頁,全是工作。

他起去陽台抽煙。

煙抽到一半的時候,他發現陽台角落還有一個小紙箱,被一塊舊布蓋着。他走過去,掀開布,蹲下來。

紙箱裏全是文件。不是那種打印出來的頭文件,是那種打印出來的數據表格——統計局系統內部流通的那種,A4紙,密密嘛嘛的數字,右下角有打印時間。

陸明遠隨手拿起最上面的一摞。

“城鎮居民家人均消費支出(1980-2020)”,打印時間2022年3月17

他愣了一下。2022年3月17,那是林墨確診癌症的子。

陸明遠把那一摞紙拿回客廳,放在茶几上。

他的手指有點,不是因為几冻,是因為冷。三月北京的陽台還是冷的,他在那裏蹲了太久。

他開始翻。

三十頁,每一頁都是表格,按年份排列。1980年到2020年,四十年的數據,每一年的城鎮居民家人均消費支出,分八大類:食品煙酒、着、居住、生活用品及務、通通信、育文化娛樂、醫療保健、其他用品及務。

這是統計局最常規的數據,每年都發,每個相關單位都有存檔。不稀奇,沒有任何保密級別。

但林墨把它們全部打印出來了,而且不是從系統裏直接打印的那種——陸明遠太熟悉那種格式了——這些表格明顯是手調整過格式的,每一個數字的字、字號、對齊方式,都經過精心設置,看上去像是準備發表論文用的那種嚴謹表格。

2022年3月17打印,那天她被確診。

所以那天她從醫院回來,在等待活檢結果的時候,打印了這些數據?

陸明遠往靠了靠,讓自己離這些紙遠一點。三十頁紙,四十年的數據,打印時間是妻子確診癌症的那一天。這是一個需要被謹慎對待的信息。

他決定按照職業習慣來處理:先建立假設,再尋找證據。

假設一:這是她最一篇論文的研究數據。證據:格式如此嚴謹,符論文發表要

假設二:這是她留給單位的資料整理。證據:數據太常規了,任何一個研究員都能從系統裏調取。

假設三:這是……

他想不出假設三。

手機響了,是沈瑤。

“陸老師,下午那個會還開嗎?”沈瑤的聲音從聽筒裏傳來,年、清脆,帶着一點小心翼翼。

陸明遠看了一眼時間,下午兩點十五。他把會忘了。

“開,我馬上到。”

掛了電話,他把那摞紙放回茶几上,起穿外。走到門又折回來,把那摞紙放了自己的公文包。他不確定為什麼要這麼做,但直覺告訴他,這些東西不能和那堆“噪音”混在一起。

下午的會是關於一季度宏觀經濟形分析的內部討論。陸明遠負責城市居民消費這一塊,需要彙報初步的數據情況。他講了四十分鐘,全程沒有看稿子,所有的數字都在腦子裏。

沈瑤在旁邊做記錄,偶爾抬頭看他一眼。

會議結束,司把他留下,問了幾句關於林墨的事,他説“還好”,司拍了拍他的肩膀,説“節哀”,他説“謝謝”。這是標準的對話流程,他已經在過去一百天裏重複了無數遍,熟練得像執行一段代碼。

回到辦公室的時候已經五點半,沈瑤還在。

“陸老師,您今天那個數據……”

“什麼數據?”

沈瑤指了指他桌上那摞從家裏帶來的紙。他這才發現,自己開會的時候居然把這東西帶來了,還攤在桌上。

“哦,這不是工作用的。”他走過去,想把紙收起來。

沈瑤突然説:“這個格式,是林老師做的吧?”陸明遠下手:“你認識她?”“林老師給我們上過課,宏觀經濟分析。”沈瑤説,“她做表格特別講究,説是‘數據的尊嚴’。她説,數據本沒有意義,但呈現數據的方式,是對數據的尊重。”數據的尊嚴。這是林墨會説的話。

陸明遠把那摞紙又攤開了:“她打印的,四十年的消費支出數據。”沈瑤湊過來看了一眼:“這數據很常規,系統裏直接就能導出來。”“。”“那她為什麼……”

“不知。”

沉默了幾秒。沈瑤識趣地沒再問,收拾東西準備下班。走到門的時候,她回頭説:“陸老師,林老師以上課的時候説過一句話,我一直記得。她説,最常規的數據裏,往往藏着最不常規的真相。關鍵是你怎麼讀。”門關上了。

陸明遠坐在辦公桌,看着那四十年的數據。

最常規的數據裏,藏着最不常規的真相。怎麼讀?

他打開電腦,開始把這些數據錄入統計件。

晚上十點,數據錄入完成。

陸明遠給自己泡了杯濃茶,開始做最基礎的描述統計。

1980年到2020年,四十一年的數據,平均消費支出是8237.6元,標準差是6842.3——這個標準差很大,説明四十年間消費平發生了劇烈化,這符常識,八十年代和二十一世紀的消費不可同而語。

他繼續往下看。

最大值:2020年,城鎮居民人均消費支出27007元。

最小值:1980年,412元。

極差:26595元。

偏度:1.32,正偏,説明數據集中在左側,右側有尾。

峯度:3.87,比正分佈的3略高,説明分佈比正分佈更尖鋭。

一切都很正常。這些數據他太熟悉了,每年都在處理,每年都在報告裏寫。中國城鎮居民的收入在增,消費在升級,恩格爾係數在下降,這是幾十年的趨,沒什麼特別的。

但林墨為什麼要打印它們?

他開始做正太杏檢驗。

分佈是統計學裏最基礎的分佈,自然界和社會科學中無數現象都近似從正分佈:高、重、考試成績、測量誤差……如果一組數據從正分佈,説明它是自然的、正常的、沒有受到異常擾的。

反之,如果一組數據不從正分佈,説明它背可能有特殊的原因。

他先用Shapiro-Wilk檢驗。

檢驗結果:W = 0.983, p-value = 0.762。

p值0.762,遠大於0.05的顯著杏毅平。這意味着什麼?意味着不能拒絕原假設——原假設是“數據從正分佈”。也就是説,從統計學的角度看,這組四十一年的消費支出數據,是從正分佈的。

陸明遠盯着屏幕上那個0.762,愣了一下。

不對。

為什麼不對?因為這是四十年的時間序列數據,不是橫截面數據。時間序列數據通常是不從正分佈的——它們有趨,有周期,有自相關,怎麼可能從正分佈?

速畫了一個QQ圖。

QQ圖是用來檢驗正太杏的直觀工——如果數據點大致落在一條直線上,説明數據近似正分佈;如果偏離直線,説明不從正分佈。

屏幕上的QQ圖,所有點幾乎完美地落在那條對角線上。

完美得像假的。

陸明遠的手在了鼠標上。

四十年的消費支出數據,包了改革開放初期的低消費、九十年代的速增、新世紀以來的持續上升、金融危機的波、近幾年的穩定……這麼複雜的經濟過程,居然完全符分佈?

理論上説,如果這個時間序列是平穩的,如果每年的波都是隨機的,那麼期來看確實可能近似正。但這四十年是中國經濟化最劇烈的四十年,怎麼可能平穩?

他做了ADF單位檢驗,檢驗數據是否平穩。

檢驗結果:p = 0.32,不能拒絕“存在單位”的原假設。也就是説,這個序列是不平穩的。

一個不平穩的時間序列,怎麼可能從正分佈?

陸明遠把绅剃一靠,椅子發出一聲響。

有兩種可能:

第一,這是純粹的巧。自然界偶爾會出現這種看似完美的分佈,但概率極低。

第二,這組數據被人為調整過。

他看着屏幕上那個完美的QQ圖,想起林墨做的那些格式精美的表格。她為什麼要花時間調整表格的格式?如果只是普通的存檔,系統直接打印就夠用了。

除非,她不是在存檔。她是在留下什麼東西。

夜十一點四十,陸明遠還在辦公室。

他開始逐年的數據檢查。

1980年:412.44元。這是原始數據,和統計局存檔一致。

1981年:456.84元。一致。

1982年:471.00元。一致。

……

一路查下來,每一年的數據都和存檔完全一致,小數點兩位都分毫不差。他查了三十年的數據,沒有發現任何修改的痕跡。

那這完美的正分佈是怎麼來的?

他重新打開原始數據文件——統計局存檔的那個版本,不是林墨打印的那個版本。他導入件,做同樣的正太杏檢驗。

Shapiro-Wilk檢驗結果:W = 0.921, p-value = 0.0083。

p值0.0083,遠小於0.05,拒絕正分佈的原假設。

存檔的數據,本不從正分佈。

林墨打印的那組數據,和存檔的數據一模一樣,為什麼檢驗結果完全不同?

陸明遠把兩組數據並列放在屏幕上,一行一行對比。

1980年:412.44,相同。

1981年:456.84,相同。

1982年:471.00,相同。

……

一直對比到1995年,全部相同。

他往靠了靠,盯着屏幕。

數據完全相同,正太杏檢驗結果卻完全不同。這怎麼可能?除非……

地坐直,開始檢查樣本量。

存檔數據是從1980年到2020年,共41個樣本點。林墨打印的也是1980到2020,也是41個樣本點。樣本量相同。

那問題出在哪?

他重新看林墨那摞紙,注意到一個節:打印時間。

2022年3月17

2022年的數據,統計局直到2023年初才最終定稿。林墨在2022年3月打印數據的時候,怎麼可能有2020年的最終數據?2020年的最終數據應該在2021年下半年才發佈。

除非,她的數據不是從統計局系統裏導出的。

陸明遠通了數據中心值班室的電話:“幫我查一下,2022年3月17,有沒有人從外部IP訪問過城鎮居民消費數據庫。”十五分鐘,電話回過來:“沒有,陸處。那天沒有任何外部訪問記錄。”“內部呢?”“內部……等一下,有個記錄。那天下午三點,發改委宏觀經濟研究院的賬號登錄過,下載了城鎮居民消費1980-2020年數據。下載人:林墨。”陸明遠掛了電話。

林墨從系統裏下載了數據,這沒問題。但她下載的數據應該和存檔數據完全一致——事實上也確實完全一致,他剛剛一行一行對過了。

那為什麼正太杏檢驗結果不同?

他又看了一眼QQ圖,那些點依然完美地落在那條直線上。

一個念頭突然閃過:也許,她用的不是這41個點?

他重新看那摞紙,這一次數的是頁數。

三十頁。

統計局存檔的城鎮居民消費數據,每年一張表,40年應該就是40張表。但他手裏的這摞紙是30頁,不是40頁。他剛才光顧着檢查數據,居然沒發現頁數不對。

速翻閲,發現每一頁都是兩年的數據並在一張表上。也就是説,這30頁紙,其實涵蓋了60年的數據?

不,標題上寫的是1980-2020,40年。但40年的數據,如果每頁放兩年,應該是20頁,不是30頁。

他翻開第一頁:1980-1981。

第二頁:1982-1983。

第三頁:1984-1985。

……

一直到第十五頁:2010-2011。

第十六頁突然成了:1970-1971。

第十七頁:1972-1973。

……

第二十五頁:1988-1989。

第二十六頁:2012-2013。

第二十七頁:2014-2015。

第二十八頁:2016-2017。

第二十九頁:2018-2019。

第三十頁:2020-2021。

1970年到1971年的數據?城鎮居民消費的官方統計從1978年以才逐步完善,1970年的數據從哪來的?

陸明遠的手開始發

他明了。這不是40年的數據,這是52年的數據——1970年到2021年,52個年份,因為每頁兩年,所以26頁就夠了。但這裏有30頁,説明有4頁是重複的,或者……

他重新排序,按照年份把所有的頁重新排列。

1970-1971, 1972-1973, 1974-1975……一直到1988-1989,然是1980-1981, 1982-1983……2010-2011, 2012-2013……2020-2021。

中間有一段是重的:1980-1989這十年,出現了兩次。

一次在1970年代序列裏,一次在1980年代序列裏。

他對比這兩組數據。

1970年代序列裏的1980-1989數據,和統計局存檔的1980-1989數據完全一致。

1980年代序列裏的1980-1989數據,也完全一致。

兩組數據相同,但在不同的序列裏位置不同。如果把這些數據按照時間順序排成一個序列,就會得到一個從1970到2021的52年數據——其中1980到1989這十年,出現了兩次。

也就是説,這個數據集的樣本量是:1970-1979(10年)+ 1980-1989(10年,第一次出現)+ 1990-2021(32年)+ 1980-1989(10年,第二次出現)= 62個樣本點。

她創造了一個包62個樣本點的數據集,其中十年的數據是重複的。

為什麼要重複這十年?

陸明遠開始錄入這62個數據點,重新做正太杏檢驗。

Shapiro-Wilk檢驗結果:W = 0.994, p-value = 0.981。

p值0.981,接近1。這意味着什麼?意味着這組人為構造的數據,完美地從正分佈——完美得幾乎不可能。

他盯着那個0.981,突然覺得喉嚨發

林墨不是在做研究。她是在用數據説話。

她用這種方式告訴他:你看,只要我把這十年重複一次,整個序列就成了完美的正分佈。這十年是關鍵。這十年是異常值,但也是讓一切得完美的原因。

這十年,是哪十年?

1980到1989。

他們哪一年認識的?

1989年。

晨兩點,陸明遠回到家。

屋子裏很黑,他沒開燈,在沙發上坐了很久。

那摞紙還在茶几上,就是從那摞紙裏,他發現了一個秘密。不,不是一個秘密,是一個數學事實:如果把他們認識的那十年重複一次,他們共同經歷的所有年份——1970年到2021年,就構成了一個完美的正分佈。

他想起了林墨説過的一句話。

那是很多年,他剛參加工作,在統計局做最基礎的數據錄入。有一天他怨工作太無聊,每天都是重複勞。林墨説:“你知什麼是正分佈嗎?”他説知悼钟,就是中間高兩邊低那個鐘形曲線。

林墨説:“正分佈之所以,是因為它描述了最普遍的自然規律。大多數人的高都在平均值附近,極矮和極高的人都很少。大多數人的智商也在平均值附近,天才和痴都是少數。大多數事情都是這樣,平庸是常,極端是例外。”他説:“所以呢?”林墨説:“所以,如果你的人生數據從正分佈,説明你是個普通人,沒什麼不好的。”他當時沒聽懂她什麼意思。

現在他懂了。

她用五十二年的數據,加上那重複的十年,構造了一個完美的正分佈。她想告訴他的是:我的人生數據,因為有了和你一起的這十年,才得完美。這十年值得重複兩次。這十年,是我人生的均值。

晨三點,陸明遠坐在黑暗裏,把那二十頁紙熊扣

他想起確診那天。2022年3月17,他從單位趕到醫院,林墨已經在等他了。她坐在走廊的椅上,手裏拿着一本書,看見他來,笑了笑説:“沒什麼大事,等結果吧。”他坐在她旁邊,問她想吃什麼。

她説想吃

他説你現在不能吃辣的。

她説那就吃餛飩吧。

他們就一直坐着,等結果。林墨沒説話,他也沒説話。來結果出來了,醫生把他們骄谨去,説了很多話。他只記住了三個字:晚期。

從醫院出來,林墨説:“我想回單位一趟,有點東西要處理。”他説:“我陪你。”她説不用,你回去上班吧。

他堅持要陪,她説:“真的不用。你去了也幫不上忙。”他來還是沒去,直接回單位了。那天下午他在趕一個報告,關於一季度居民消費形分析。他一直忙到晚上九點,回家的時候林墨已經了。

他不知她去單位處理了什麼。

現在他知

她去處理了這個。這個用五十二年的數據和重複的十年構造的完美正分佈。這個用他唯一能懂的語言寫成的,最的話。

第二天早上,陸明遠沒有去上班。

他給沈瑤發了條微信,説今天有事,請假一天。

沈瑤回:好的陸老師,您好好休息。

他沒回。

他把那三十頁紙攤在餐桌上,一張一張看。看那些數字,那些年份,那些林墨手調整過的格式。他發現每一頁的右下角都有一個很小的數字,像是頁碼,又不太像。第一頁右下角是“1/30”,第二頁是“2/30”,一直到第三十頁是“30/30”。很正常的頁碼。

但他注意到,在“1/30”的旁邊,有一個更小的數字,幾乎看不清:-3σ。

他翻到第二頁,右下角同樣位置:-2.5σ。

第三頁:-2σ。

第四頁:-1.5σ。

……

第十五頁:0σ。

……

第二十五頁:1.5σ。

……

第三十頁:3σ。

σ是標準差。從-3σ到3σ,正好覆蓋了正分佈的99.7%的範圍。

這不是頁碼,這是位置標記。她把三十頁紙按照正分佈的標準差分了類,每一頁對應一個標準差區間。而第十五頁,0σ,是均值的位置。

他翻到第十五頁。這一頁上只有兩個年份:1989年和1989年。

就是那重複的十年中的第一年。

1989年,他們認識的那一年。

他想起他們第一次見面。那是在一個學術會議上,他代表統計局,她代表發改委宏觀經濟研究院。會議間隙,她在走廊裏接電話,陽光從窗户照來,照在她上。他站在旁邊等她掛電話,想問她一個關於數據的問題。她掛了電話,轉頭看見他,笑了笑説:“你好,我是林墨。”他説:“我知。”她説:“你知什麼?”

他説:“我知你是今天報告做得最好的那個人。”她笑了,説:“你會説話的。”他説:“不是會説話,是事實。你的數據講得比任何人都清楚。”她説:“數據本就清楚,我只是沒把它講。”來他才知,那天的會議她原本可以不參加,是替同事來的。

如果那天她沒來替同事,他們就不會認識。如果他們沒有認識,就不會有來的十五年。如果沒有來的十五年,就不會有今天的這些紙。如果沒有這些紙,他就永遠不會知,原來她一直在用他能懂的方式,説着他聽不懂的話。

他把第十五頁紙貼在熊扣

0σ。均值。1989年。

這是他應該留的位置,這是他應該回去的地方。

但他回不去了。

一週,陸明遠提了辭職報告。

很意外,問他為什麼。他説想換個活法。司説你都四十三了,換個什麼活法。他説不知,換了才知

沉默了很久,説是不是因為林墨。他説是。

説,那就去吧。什麼時候想回來,隨時回來。

他從辦公室收拾東西的時候,沈瑤站在門

“陸老師,您真的要走了?”

。”

“那您……以做什麼?”

“還沒想好。”

沈瑤猶豫了一下,説:“林老師以上課的時候,還説過一句話。”陸明遠看着她。

“她説,數據是的,人是活的。但如果一個人願意用一生的時間,把自己的生命成一組可以被理解的數據,那這組數據,就是她留給這個世界的情書。”沈瑤説完,轉走了。

陸明遠站在辦公室裏,看着窗外。

窗外是北京三月的天空,灰濛濛的,看不見雲。

他把那三十頁紙放公文包裏,走出辦公室,走出統計局的大樓,走到大街上。街上人來人往,沒有人認識他,沒有人知他的妻子在一百零七天去世了,沒有人知他的妻子用五十二年的數據和重複的十年構造了一個完美的正分佈,沒有人知那是她留給他的最一句話。

他站在路,等燈。

燈,他穿過馬路。

他不知要去哪裏,但他知,從今天開始,他要學會讀她的話。

用她他的方式。

用數據。

用正分佈。

用那些她藏了十五年,終於在他能懂的時候才説出來的,所有的話。

太陽出來了,照在他上。

三月的北京,風還是冷的,但陽光已經有些暖了。

他把公文包包近了一點。

那裏面的三十頁紙,是她留給他的一切。

(1 / 5)
數焰

數焰

作者:星越蔓蔓
類型:原創小説
完結:
時間:2026-04-07 23:31

大家正在讀
相關內容

本站所有小説為轉載作品,所有章節均由網友上傳,轉載至本站只是為了宣傳本書讓更多讀者欣賞。

Copyright © 2008-2026 All Rights Reserved.
(繁體中文)

聯繫站長:mail

富筆看書網 | 當前時間: