Skip to main content

Posts

Showing posts from June, 2020

網路不是核心 應用才是 老賊就是不願接受

https://mp.weixin.qq.com/s/ULbe-XjbxhH0r8vv2-XLZQ 以前讨论软件定义,现在讨论5G和边缘计算的很多观点,实际上在潜意识里还是网络中心论,还是把网络置于食物链的顶端和主导环节 互联网公司主导的网络里,主要的资源是投入到对网络基本模型、基本能力的研发和创新上,是在补肾而不是补脑。互联网行业对网络的控制策略往往并不复杂,甚至刻意避免复杂 但在网络主导的圈子里,很长时间里还是把希望寄托在给控制平面补充六个核桃上,总觉得是网络管控的大脑不够聪明差导致强大的身体机能英雄无用武之地,而且对聪明的定义往往聚焦于算法,或寄托在出奇制胜三两招上,对系统性的问题反而比较轻视。 我也知道我说了这些以我为中心的看法并没有什么太大的用处

也有這本書了

Building a Future-Proof Cloud Infrastructure: A Unified Architecture for Network, Security, and Storage Services

Egress control

https://blog.fleeto.us/post/egress-monitoring-access-control/ 在SLB裡的SNAT 是為了對應主機的default gateway需特別指定的問題 egress將一直都會是問題 istio的解法算是最暴力的解法

from 黑暗執行緒

黑暗執行緒 Side Project 寫爬蟲有感。 如果有人跟你說「大數據」一點都不難,寫爬蟲超簡單,他一定是<del>壞心想騙你</del>好心怕把你嚇壞,沒說光第一關大魔王就很可怕。如果沒現成資料想自己抓網頁建基本資料庫,光是抓資料跟洗資料這段,就很容易把你搞到懷疑人生,而且還相當吃經驗值。 寫 Http Client 抓回網頁很簡單,難在解析手工輸入的各式文件擷取出資料,即使制式表格,打錯字的、存不同 Encoding 的、動到欄位標題... 就夠精采的,魔鬼全在細節裡。 常見的狀況是:花一小時寫幾行程式擷取正確率就高達 60%,但提高到 70% 要兩小時,推上 80% 要耗時四小時,花八小時好不容易到 90%... 直到你嘆一口氣,「算了,這幾百筆用手工改好了。」 如果你不熟 Regular Expression,一般會更早就放棄改用「工人智慧」。