上周我們組出了紕漏,Production 運轉過程中能 down 了兩小時。 查了查懷疑和一個Configuration有關。 Error Log 裏說一組Config的某個參數 的名字在兩個Prod Server 上不Match。 Production 的這個Configuration 都是小老板做的。 後來他們想在UAT 上複製錯誤,我因為在UAT看見過類似錯誤,一般我看見就改正了,不改也沒發現有大問題。正巧那天UAT的一個Server也有點問題,我就在電話上講可能UAT 也還有類似的Configuration 的問題。 後來小老板去看果然發現有一個地方也有這個問題。
結果今天跨組開會時,一個同組的老印就說我其實知道UAT 有問題,但一直不告訴他們。 他用一種半開玩笑的口吻。 我就說沒有啊,我是說UAT 可能也有類似問題,何況並不知道這個Config的問題有什麽後果,也 沒有人天天去看Log。 然後小老板就說,O, 現在你又說是“可能”了。 下來我聽他們還在私下嘀咕我說沒說“可能”二字,反正對我挺有意見的。
我就接觸了UAT,對PRODUCTION的這個COnfig 根本就沒Involve。 小老板又不是Copy我在UAT的config,他自己搞錯了我覺得沒有理由認為我有責任。 因為很多PROD 的東西都是我在Config,我們組一些不知情的人就誤以為這個東東 也是我Config 的,交談中才知道是小老板。 我現在不知道小老板怎麽匯報給大老板的,你們覺得我有必要跟大老板解釋Production不是我Config 的而是小老板一手操作的嗎?我本來不打算去解釋的,但看了今天小老板幾次談起UAT 也有類似錯誤又說我知道UAT有問題沒匯報時我總覺得不太放心他背後怎麽講這事。 你總不能說UAT Config有Typo,你自己在Prod 就可以有一堆錯吧,你又不是照UAT 搬過去的,起的名字都不一樣,和UAT 沒關係。我看見UAT 有錯自己改了要匯報什麽呢,如果還有沒改完的我也不知道啊。 我覺得我被攪進去了。大老板對這事看得挺重的,因為PROD down 時很難堪。小老板當時在電話上隻說他發現一個Config 的錯,也不說誰做錯的,什麽樣的錯,大老板幾次說他很感興趣到底是什麽錯,後來我就問是不是這個東西的Config 的錯,還把錯講了出來討論了一下。 大老板後來問誰來解決這個問題,小老板就說這事他來解決,也沒說是他搞錯的。
你們說我該忍了算了還是去跟大老板解釋一下?怎麽解釋比較好?