it-swarm-vi.tech

Tai nạn quản trị hệ thống tốt nhất

Tôi đang tìm kiếm những câu chuyện thú vị về tai nạn quản trị hệ thống mà bạn đã có. Xóa email của CEO, định dạng ổ cứng sai, v.v.

Tôi sẽ thêm câu chuyện của riêng tôi như một câu trả lời.

87
Alan H

Tôi rất vui khi khám phá sự khác biệt giữa lệnh "killall" của linux (giết tất cả các quy trình khớp với tên đã chỉ định, hữu ích để ngăn chặn zombie) và lệnh "killall" của solaris (giết tất cả các quy trình và tạm dừng hệ thống, hữu ích cho việc dừng máy chủ sản xuất trong giữa giờ cao điểm và khiến tất cả đồng nghiệp cười nhạo bạn trong một tuần).

133
Tim Howland

Tôi phụ trách proxy web công ty của chúng tôi lúc đó là sản phẩm của Netscape. Trong khi chơi xung quanh trong các biểu mẫu quản trị viên (đó là giao diện dựa trên web), có một nút lớn (và tôi thề là màu đỏ) có ghi Xóa Cơ sở dữ liệu người dùng. Không có vấn đề, tôi nghĩ. Hãy xem những tùy chọn mà nó mang lại cho tôi khi tôi nhấn vào đó. Chắc chắn sẽ có một lời nhắc nhở xác nhận nếu không có lựa chọn nào.

Vâng, không có xác nhận. Không có lựa chọn. Không còn người dùng.

Vì vậy, đã đến gặp ông Solaris Sysadmin và nói rằng tôi đang rất cần một bản khôi phục từ băng mà ông trả lời: "Tôi không sao lưu cái hộp đó lên."

"Uh, trở lại," tôi vặn lại.

"Tôi không sao lưu cái hộp đó lên. Nó nằm trong danh sách những thứ cần thêm vào vòng quay dự phòng nhưng tôi vẫn chưa tìm được nó."

"Máy chủ này đã được sản xuất gần 8 tháng!" Tôi hét lên.

nhún vai , anh trả lời. "Lấy làm tiếc."

73
squillman

Cách đây nhiều năm, công ty tôi làm việc đã có một khách hàng chạy bản sao lưu hàng đêm của Máy chủ NT 4.0 của họ thành ổ đĩa Jaz (như đĩa Zip dung lượng cao).

Chúng tôi thiết lập một tệp bó, chạy như một công việc theo lịch trình qua đêm. Mỗi buổi sáng, họ sẽ thu thập đĩa đêm qua từ ổ đĩa và trước khi họ rời đi vào buổi tối, họ sẽ đưa đĩa tiếp theo vào trình tự.

Dù sao, tệp bó trông giống như thế này (ổ Jaz là ổ F :).

@echo off
F:
deltree /y *.*
xcopy <important files> F:

Dù sao, một đêm nọ, họ quên đặt đĩa vào. Thay đổi ổ F: không thành công (không có ổ đĩa) và tệp bó tiếp tục chạy. Thư mục làm việc mặc định cho tệp bó? C :. Lần đầu tiên tôi từng thấy một thói quen sao lưu phá hủy máy chủ mà nó đang sao lưu.

Tôi đã học được một chút gì đó về sysadminning (và xử lý ngoại lệ) ngày hôm đó.

Jim.

PS: Cách khắc phục? "deltree/y F:\*. *".

66
Jim OHalloran

root @ dbhost # find/-name core -exec rm -f {} \;

Tôi: "Bạn không thể vào được? OK. Tên DB là gì?"

Cu: "Lõi."

Tôi: "Ồ."

61
Dave

Tôi thích cách mọi người đủ điều kiện kể câu chuyện của họ với "khi tôi còn trẻ/xanh" như thể họ sẽ không bao giờ làm điều đó một lần nữa. Tai nạn có thể xảy ra với ngay cả những chuyên gia dày dạn nhất.

Khoảnh khắc tồi tệ nhất của tôi rất tệ, tôi vẫn cảm thấy hồi hộp khi nghĩ về nó ...

Chúng tôi đã có một SAN với dữ liệu sản xuất trên đó. Quan trọng đối với công ty. "Người cố vấn" của tôi đã quyết định mở rộng một phân vùng để giải phóng một số không gian đĩa. Bạn có thể thấy nơi này đang hướng tới không? rằng phần mềm SAN có thể thực hiện việc này, trong giờ sản xuất và không ai có thể nhận ra. Chuông báo thức đã bắt đầu reo, nhưng im lặng một cách rõ rệt. Ông nói rằng ông đã thực hiện "vô số lần trước "không có vấn đề gì. Nhưng đây là vấn đề - anh ấy đã cho tôi bấm vào nút nói" bạn có chắc không? "! Khi tôi mới vào công ty, tôi cho rằng anh chàng này biết anh ta đang nói về điều gì. tin tốt là LUN đã được gia hạn. Tin xấu là ... tôi cũng biết có tin xấu khi tôi bắt đầu thấy lỗi ghi đĩa trên hộp Windows.

Tôi rất vui vì tôi đã mặc quần nâu.

Chúng tôi đã phải giải thích tại sao 1TB dữ liệu đã biến mất vào giờ ăn trưa. Đó là một ngày thực sự, thực sự tồi tệ.

Đó thực sự là một nguyên tắc tốt - trước khi bạn làm điều gì đó mà bạn nghi ngờ, hãy tưởng tượng phải giải thích với quản lý nếu có sự cố xảy ra. Nếu bạn không thể nghĩ ra một câu trả lời hay để giải thích cho hành động của mình thì đừng làm điều đó.

60
PowerApp101

Nagios đã ping chúng tôi vào một buổi sáng khi giờ làm việc bắt đầu nói rằng nó không thể kết nối với một máy chủ không quan trọng. Ok, đi đến phòng máy chủ. Đó là một máy chủ cũ, Dell 1650 được mua vào năm02 và chúng tôi biết rằng những năm 1650 đã gặp sự cố về phần cứng. PFY đâm vào nút nguồn. Không có gì. Nhấn nó một lần nữa và giữ nó trong năm giây để 'bật nguồn' ... nó sẽ ghi đè lên khả năng bảo vệ lỗi của BMC, vì không có DRAC, không có cách nào để kiểm tra nhật ký BMC mà không cần bật nguồn lên khung máy.

Máy bắt đầu POST, và sau đó chết một lần nữa. Tôi đứng trên nó và đi, "Tôi ngửi thấy mùi khói." Chúng tôi kéo máy chủ ra trên Rails, và một trong những bộ nguồn cảm thấy ấm, vì vậy PFY kéo nó và chuẩn bị đóng hộp lại. Tôi nói, "Không, đó không phải là khói cung cấp điện, đó là khói bo mạch chủ."

Chúng tôi mở trường hợp một lần nữa và tìm kiếm nguồn gốc của mùi cháy. Hóa ra một cuộn dây dẫn và tụ điện có thứ gì đó đã tắt bộ điều chỉnh điện áp trên bo mạch chủ, và phun đồng nóng chảy và tụ điện đi khắp mọi thứ, rút ​​ngắn một loạt các thứ và về cơ bản tạo ra một mớ hỗn độn lớn.

Điều tồi tệ nhất đối với tôi là nhận ra rằng tôi đã hút đủ phần cứng để nhận ra sự khác biệt giữa mùi của bo mạch chủ bị cháy và nguồn điện bị cháy.

54
Karl Katzke

Ba ngày trước (nghiêm túc) Tôi đã đăng nhập từ xa vào máy chủ của trường, cài đặt Gói dịch vụ 2 trên máy chủ tệp Windows Server 2008.

Tôi quyết định lên lịch khởi động lại cần thiết vào tối muộn, khi giáo viên sẽ không đăng nhập để hoàn thành thẻ báo cáo cuối năm của họ. Tôi đã gõ một cái gì đó như:

 lúc 23:59 "tắt máy -r -t 0" 

... mà có thể đã làm việc tốt.

Nhưng rồi tôi lần thứ hai tự đoán. Cú pháp 'tắt máy' của tôi có đúng không? Tôi đã cố gắng để xem trợ giúp sử dụng bằng cách gõ

 tắt máy/h 

... và ngay lập tức mất kết nối RDP của tôi. Hoảng sợ, tôi nhấn Google cho cú pháp. Một tìm kiếm nhanh cho thấy phiên bản tắt máy chủ 2008 bao gồm công tắc/h, mà (như bạn có thể đoán) đã ngủ đông máy.

Giáo viên bắt đầu gọi cho tôi trong vòng vài phút để báo cáo rằng họ không còn có thể mở hoặc lưu thẻ báo cáo mà họ đã làm việc. Vì tôi đang ở ngoài công trường và phòng máy chủ đã bị khóa, tôi phải gọi trực tiếp cho hiệu trưởng và hướng dẫn cô ấy thông qua quá trình bật lại máy.

Hôm nay tôi đã mang bánh quy tự làm cho mọi người như một hình thức xin lỗi.

47
Brent D

Trong một công việc trước đây, chúng tôi đã có một hệ thống cây nhà lá vườn tuyệt vời đã ghi lại và lưu trữ từng mẩu thư được nhập, để lại hoặc ở lại trong công ty.

Thổi bay toàn bộ hộp thư của bạn? Không vấn đề gì! Tìm kiếm một mẩu thư mà ai đó đã gửi cho bạn một tuần/tháng/năm trước nhưng bạn không thể nhớ ai đã gửi nó hoặc chủ đề đó là gì? Không vấn đề gì! Chúng tôi sẽ chỉ phân phối lại mọi thứ từ tháng Hai cho bạn vào một thư mục đặc biệt.

Tại một số thời điểm, cần phải có Giám đốc điều hành của công ty để theo dõi thư đi giữa một đối thủ cạnh tranh và một nhân viên bán hàng nội bộ dưới sự nghi ngờ. Vì vậy, chúng tôi thiết lập một kịch bản hơn là chạy mỗi đêm và gửi thư có liên quan từ ngày hôm trước cho Giám đốc điều hành. Không vấn đề gì!

Khoảng một tháng sau Lời của một vấn đề khẩn cấp gấp đôi cộng lại từ trên cao. Có vẻ như Giám đốc điều hành đang đọc qua danh sách các thư được gửi tới $ OTHERCOMPANY, ông đã tìm thấy thư này:

To: [email protected]$OTHERCOMPANY
From: CEO
Subject: CEO has read your message (subject line here)

Đương nhiên, CEO là một người quan trọng và tất cả, anh ta quá bận rộn để nhấp vào tất cả các hộp thoại "Gửi biên nhận đã đọc" trong Outlook và đã cấu hình ứng dụng khách của mình để gửi tất cả. Một trong những thông báo bị bộ lọc giám sát bắt gặp có bộ yêu cầu nhận đọc. Đoán xem Outlook đã làm gì? Chắc chắn đã làm hỏng việc giám sát 'bí mật'.

Nhiệm vụ tiếp theo của chúng tôi: thêm quy tắc vào bộ lọc thư để chặn biên lai đọc từ CEO đến công ty đó. Vâng, đó là cách dễ nhất. :)

37
MikeyB

Ahhh, của tôi là khoảng 10 năm trước, khi tôi vẫn còn ướt chân. Tôi đã có niềm vui cài đặt sao lưu pin trên tất cả các máy tính lập trình viên. Họ cũng muốn phần mềm được tải để cảnh báo mất điện và tắt đúng cách.

Vì vậy, tôi đã thiết lập nó trên máy tính của mình để kiểm tra tất cả mọi thứ trước tiên và chắc chắn rằng tất cả đều hoạt động. Vì vậy, tôi ngắt kết nối dây nguồn và thông báo xuất hiện trên màn hình của tôi. "Mất điện bên ngoài, bắt đầu tắt hệ thống".

Vì vậy, tôi nghĩ, Hey tuyệt, nó đã làm việc. Nhưng vì một số lý do kỳ lạ, tôi thậm chí không nhớ, nó đã gửi tin nhắn đó dưới dạng tin nhắn mạng để tất cả hơn 200 máy tính trong công ty nhận được tin nhắn đó, nơi có hơn 100 người dùng nơi lập trình viên.

Vâng, nói về hàng loạt quái vật !!

Tôi cúi thấp đầu ở nơi đó một lúc!

36
jherlitz

Tôi thường sử dụng lệnh "sys-unconfig" trên các máy Solaris để đặt lại dịch vụ Tên máy, I.P. địa chỉ, và mật khẩu root. Tôi đang ở trên một hệ thống người dùng và tôi đã đăng nhập vào máy chủ cài đặt tòa nhà và tìm kiếm thứ gì đó (với quyền root), sau đó quên rằng tôi đã đăng nhập vào một máy khác (không mô tả "#" Nhắc) Tôi đã chạy lệnh "sys-unconfig".

# sys-unconfig     
        WARNING

This program will unconfigure your system.  It will cause it
to revert to a "blank" system - it will not have a name or know
about other systems or networks.

This program will also halt the system.

Do you want to continue (y/n) ? y

Connection closed

#

Thông báo "kết nối đã đóng" đó dần dần chuyển sang hoảng loạn ... tôi đã đăng nhập vào máy nào khi chạy lệnh đó.

Điều tồi tệ nhất của việc này không phải là khoảng thời gian khó khăn mà đồng nghiệp của tôi dành cho tôi, đó là tôi đã làm điều tương tự một tháng sau đó.

35
Alan H

Tôi đã có một cái khá tốt. Phải thừa nhận rằng, trước đây tôi là một sysadmin, nhưng vẫn liên quan đến công nghệ nên tôi nghĩ tôi sẽ thêm nó.

Ngày trước, tôi đã làm việc như một công nghệ satcom/băng rộng cho USAF. Vừa tốt nghiệp trường kỹ thuật, tôi thấy mình đóng quân ở Hàn Quốc. Ngay sau khi đến ga, một cơ hội đã nảy sinh để đi xuống phía nam với các "ông lớn" đã ở đó một thời gian và thực sự làm việc trên một số thiết bị trong thế giới thực, (ví dụ: 'sản xuất').

Tôi đã đi xuống cùng với phi hành đoàn và với tư cách là một công nghệ trẻ, háo hức, đang háo hức một chút, khá phấn khích trước viễn cảnh có được một thiết bị thực sự truyền qua giọng nói và dữ liệu quân sự TRỰC TIẾP.

Để bắt đầu với tôi từ từ, họ đưa cho tôi một cuốn sổ tay, chuyển sang phần bảo trì phòng ngừa và chỉ cho tôi theo hướng bốn giá đỡ chứa nhiều bộ ghép kênh kỹ thuật số lớn. Các thiết bị đã đủ dễ dàng, chúng tôi đã bao gồm các thiết bị tương tự trong trường công nghệ.

Trang đầu tiên của hướng dẫn đọc; "Cấp nguồn cho bộ ghép kênh hai chiều. Xoay cả hai công tắc phía sau sang vị trí BẬT và đợi thiết bị bật nguồn, sau đó bắt đầu thử nghiệm." Tôi nhìn lên, và đã có nguồn điện ÁP DỤNG!

Tôi đã ở trong tình trạng khó khăn cho chắc chắn. Không biết làm thế nào để tiến hành, tôi đã bắn hết sức mình, 'Ummmm .. Kinda mất ở đây' nhìn vào đàn anh.

Anh ấy nhìn tôi và cười, "Không, không, không sao. Bạn có thể bỏ qua phần đó trong danh sách kiểm tra." Sau đó, khi anh ta chú ý đến vẻ mặt của tôi, (vì chúng tôi được dạy ở trường KHÔNG BAO GIỜ, EVER bỏ qua bất kỳ phần nào trong danh sách kiểm tra, và đó là cái chết chắc chắn và hủy diệt nếu ai đó làm vậy), anh ta nhìn nghiêm túc đối mặt và nói, "Bỏ qua CHỈ phần đó! Làm theo phần còn lại của nó, đến bức thư!"

Nghiêm túc, tôi đã chạy qua các hướng dẫn nhiều bước PM, hạnh phúc như một con ngao và tự hào rằng họ đã để một công nghệ xếp hạng thấp như vậy, (mặc dù thông minh) thực hiện công việc quan trọng này.

Ở đâu đó giữa danh sách kiểm tra bảo trì phòng ngừa thứ năm và thứ sáu trên các bộ ghép kênh khổng lồ này, tôi bắt đầu nhận thấy mức độ hoạt động tăng lên xung quanh mình. Điện thoại reo, mọi người di chuyển nhanh chóng. Vẻ ngoài kỳ quặc đã được trao đổi.

Cuối cùng, một nhóm người chạy đến chỗ tôi, đứng đầu là một trong những kỹ thuật viên cao cấp đã hạ bệ tôi.

"Này! Chúng ta đang thấy sự cố ngừng hoạt động dữ liệu lớn và chúng ta đã cô lập/truy tìm đường dẫn trở lại giá đỡ mà bạn đang làm việc! Bạn có thấy điều gì lạ không .."

(Vào thời điểm đó, anh ta đã bị cắt bởi một trong những người khắc phục sự cố, người đã tìm đường đến nhóm bộ ghép kênh đầu tiên mà tôi đã thực hiện các PM.)

"HOLY NUTS! HỌ ĐÃ BẮT ĐẦU! HÃY THAM GIA NGAY BÂY GIỜ !!!!"

Trong một thời gian ngắn, tôi quan sát khi họ vội vã chạy qua bước đầu tiên trong hướng dẫn, "Xoay cả hai công tắc phía sau sang vị trí BẬT ..." Khi công nghệ cao cấp đã xong, anh ấy đến chỗ tôi và hỏi tôi đang nghĩ gì của, bằng cách tắt các phần quan trọng của thiết bị.

Sợ mất trí, tôi đưa cho anh ta danh sách kiểm tra mà tôi đã theo dõi, thề rằng tôi đã không đi chệch hướng ở TẤT CẢ. Rằng tôi đã theo dõi nó, 'gửi thư' như anh đã chỉ dẫn.

Sau một lúc, anh cười và chỉ ra vấn đề nằm ở đâu.

Trong hướng dẫn, bước FINAL trong danh sách kiểm tra bảo trì phòng ngừa là:

"Ghi lại đọc đầu dò cuối cùng, lau bảng điều khiển phía trước, loại bỏ tất cả bụi và hạt, sau đó chuyển cả hai công tắc nguồn phía sau sang vị trí TẮT."

:)

27
Greg Meehan

Tôi đang tải lại một hệ thống cho một ai đó và trong quá trình sao lưu thủ công tôi đã hỏi anh ta câu hỏi "Bạn có chương trình nào khác mà bạn sử dụng không?" và "Có điều gì khác quan trọng bạn làm trên máy tính không?"

Anh ấy nói "không" lần nào.

Tôi đã bị thuyết phục và định dạng các ổ đĩa.

Khoảng 30 phút sau anh nói "trời ơi" và đặt cả hai tay lên đầu.

Hóa ra anh ta đã làm việc với một kịch bản sách trong hơn 10 NĂM trong một chương trình chuyên biệt. Điều này đã trở lại khi các chương trình được sử dụng để lưu dữ liệu người dùng trong thư mục tệp chương trình của nó và tôi đã bỏ lỡ nó.

Ai cũng vậy.

Anh ấy không giận tôi, nhưng đó là một cảm giác tỉnh táo.

26
MathewC

Đó là một tai nạn sysadmin .. trong chừng mực các sysadins thỉnh thoảng phải vận chuyển một số lượng lớn máy móc từ điểm A đến điểm B (trong đó A và B dường như luôn bị ngăn cách bởi một vài chuyến thang bộ trong tòa nhà không có thang máy). Trong chuyến đi thứ năm trong ngày, tôi dừng lại để có ba chuyến bay lên từ tầng tải tầng hầm để trò chuyện với ai đó đang đi xuống, chống đỡ tòa tháp kích thước đầy đủ mà tôi đang ngồi trên lan can bên trong của cầu thang mở và ... tốt, bạn đoán ... hơi mất cảm giác với tôi. Nó lao thẳng xuống giếng và khi nó chạm đáy, er ... không quá nhiều với chức năng cho cái đó! Tổng số bộ phận có thể cứu được: hai thanh RAM, một ổ đĩa mềm và một thẻ ISDN (Chúa phù hộ cho những người kỹ thuật Hermstedt!). Mọi thứ khác hoặc bị nứt, ọp ẹp hoặc vỡ thành những mảnh nhỏ.

Nhờ ân sủng của Thiên Chúa, không ai được đi bên dưới, điều mà, may mắn cho tôi, là đầu tiên của ông chủ tôi, vì vậy tôi phải giữ công việc của mình. Cảm thấy rất ốm trong một giờ hoặc lâu hơn.

Đạo đức: trọng lực luôn chiến thắng!

26
avstrallen

Sở thích cá nhân của tôi không thực sự là của tôi, và tôi rất vui vì điều đó. Hãy xem đây.

23
RainyRat

Điều này đã không xảy ra với tôi, nhưng

Tôi đang làm việc tại một công ty sản xuất phần mềm chạy trên các máy Linux do khách hàng cung cấp. Về cơ bản, chúng tôi sẽ 'tiếp quản' các máy móc, cấu hình hoàn toàn chúng theo thông số kỹ thuật của chúng tôi và thực hiện tất cả việc quản lý và giám sát. Về cơ bản, chúng tôi là một nhóm gồm 10-15 sysadins, quản lý hàng ngàn máy chủ cho hàng trăm khách hàng. Những sai lầm chắc chắn sẽ xảy ra.

Một người trong nhóm chúng tôi đã tìm thấy một số vấn đề trên máy chủ (tôi tin là bản sao lưu) và quyết định rằng anh ta nên chạy fsck trên đó. Anh ta đã dừng tất cả các dịch vụ liên quan, đảm bảo rằng hệ thống đã được sao lưu gần đây và sau đó chạy fsck, nhưng nó phàn nàn rằng hệ thống tập tin đã được gắn kết. Vì chúng tôi ở xa và không có quyền truy cập từ xa (DRAC, ILO, v.v.), anh ấy không thể thực hiện fsck, nhưng anh ấy khá chắc chắn rằng an toàn khi làm điều đó với hệ thống tập tin được gắn, nếu bạn cẩn thận.

Anh quyết định tự thử bằng cách chạy fsck trên phân vùng gốc của mình, với kết quả có thể dự đoán được - anh đã làm hỏng phân vùng gốc của mình và không thể khởi động được nữa.

Bối rối, anh ấy đi đến và nói chuyện với trưởng nhóm của chúng tôi. Người dẫn đầu nói rằng anh ta khá chắc chắn rằng bạn không thể làm điều đó, và thành viên trong nhóm nói 'Chắc chắn bạn có thể!', Lấy bàn phím của người dẫn và cho anh ta thấy rằng bạn có thể - bằng cách chạy fsck trên phân vùng gốc của khách hàng tiềm năng. Mà hoàn toàn hỏng phân vùng gốc NGÀI.

Kết quả cuối cùng? Không có dữ liệu khách hàng bị mất, nhờ thử nghiệm của thành viên trong nhóm. Hai ngày năng suất của nhân viên đã bị mất, nhưng nó đáng giá hơn rất nhiều so với dữ liệu trên máy của khách hàng. Và cho hồ sơ? Bạn có thể chạy fsck trên một ổ đĩa được gắn, nhưng chỉ để xác minh dữ liệu. Không sửa chữa nó. Đó là sai lầm của thành viên trong nhóm.

-

Để thêm câu chuyện của riêng tôi, tôi đã làm việc tại cùng một công ty và đang cố gắng thiết lập lại mật khẩu người dùng. Hệ thống của chúng tôi từ chối cho phép tôi đặt mật khẩu mà anh ấy cần, bởi vì nó đã theo dõi băm mật khẩu cũ và từ chối cho phép bạn sao chép mật khẩu. Cơ chế rất đơn giản: nó xác nhận mật khẩu của bạn so với hàm băm gần đây nhất trong cơ sở dữ liệu.

(Và đối với bản ghi, nó cần phải là mật khẩu cũ vì đây là tài khoản được chia sẻ và đảm bảo mọi người đều biết mật khẩu mới là không thực tế)

Tôi quyết định chỉ đi vào cơ sở dữ liệu người dùng và xóa các bản ghi mới để nó sẽ sử dụng bản cũ hơn. Tất cả chỉ là SQL (chạy phiên bản Sybase cổ), vì vậy thật dễ dàng. Đầu tiên, tôi phải tìm hồ sơ:

SELECT * FROM users_passwords WHERE username='someuser';

Tôi tìm thấy kỷ lục cũ anh muốn giữ; Có hai cái nữa trước mặt nó. Tôi quyết định khéo léo và chỉ xóa bất cứ thứ gì mới hơn bản ghi cũ. Nhìn vào tập kết quả, tôi thấy rằng mật khẩu cũ là ID # 28 trong cơ sở dữ liệu và mật khẩu mới là ID #several nghìn (hệ thống rất bận). Điều đó thật đơn giản, tất cả các hàng cũ đều> 28, vì vậy:

DELETE FROM users_passwords WHERE id > 28;

Không có gì tệ hơn là thực hiện một số thao tác cắt hàng đơn giản và thấy '212.500 hàng bị ảnh hưởng'. May mắn thay, chúng tôi có hai máy chủ cơ sở dữ liệu chính (có ID người dùng), nhưng Sybase (ít nhất là phiên bản của chúng tôi) không hỗ trợ sao chép tự động, do đó, nó không tự động xóa sạch các bản ghi cũ. Việc lấy một bảng của user_passwords và nhập lại nó là một vấn đề không quan trọng. Tuy nhiên, một tiếng 'oh f ** k!' Khá lớn chốc lát.

23
Dan Udey

Đã gõ kill 1 là root. init và tất cả các con của cô ấy đã chết. Và tất cả con cái của họ. v.v ... Rất tiếc.

Ý tôi muốn gõ là kill %1

Sau khi tôi nhận ra mình đã làm gì, tôi chạy đến bảng điều khiển của một LỚN máy phân loại kiện len và nhấn nút dừng khẩn cấp. Điều này đã ngăn máy tự xé thành bit, vì tôi vừa giết phần mềm điều khiển nó.

22
Jason Tan

Câu lệnh XÓA mà không có mệnh đề WHERE, trên cơ sở dữ liệu người bảo trợ trực tiếp của khách hàng.

22
Ian Boyd

Một mục yêu thích khác của tôi:

Khi thiết lập máy tính và máy in laser cục bộ trên hệ thống, tôi đã có ý tưởng sáng suốt để cắm cả hai vào bộ lưu điện của máy tính. Bạn đã bao giờ thử in với máy in laser cục bộ khi cắm vào UPS máy tính để bàn chưa? Chà, nếu bạn không biết, nó có xu hướng kéo tất cả các ampe ... Khởi động lại máy tính ... Và công việc in không bao giờ kết thúc ...!

Bao giờ nhận được cuộc gọi: 'Bất cứ khi nào tôi in, nó sẽ khởi động lại máy tính của tôi và không in !!!'?

Ôi trời!

Liên doanh

22
JFV

Chúng tôi đang ở trong tình trạng mất điện và thấy rằng UPS đang chạy ở mức 112% tải được định cấu hình. Đây không phải là vấn đề vì chúng tôi đang chạy trên máy phát điện vào thời điểm đó.

Vì vậy, chúng tôi đã đi khắp nơi kéo cáp điện dự phòng để giảm mức sử dụng điện trên UPS đó (chúng tôi có hai, một lớn hơn nhiều so với cái kia). Chúng tôi đã chuyển sang mạng chuyển phòng máy chủ (đây là phòng máy chủ có tất cả các máy chủ nội bộ cho công ty, với khách hàng phải đối mặt với máy chủ trong phòng máy chủ khác). Công tắc là một công tắc cấp doanh nghiệp lớn với ba bộ nguồn trong đó. Các nguồn cung cấp là N + 1 vì vậy chúng tôi chỉ cần hai để chạy công tắc.

Chúng tôi chọn một dây cáp và kéo nó ra. Thật không may cho chúng tôi, hai cái kia đã được cắm vào một dải năng lượng duy nhất, nó đã kịp thời thổi khi tải lên trên hai bộ nguồn được cắm vào nó. Sysadmin sau đó hoảng loạn và cắm cáp thứ ba vào. Công tắc đã cố gắng bật lên, đặt toàn bộ tải của công tắc cho đến nguồn cung cấp điện duy nhất. Thay vì nguồn điện ngừng hoạt động, nó phát nổ trong một cơn mưa tia lửa không cách mặt tôi 12 inch khiến tôi nhảy trở lại vào giá đỡ máy chủ.

Không còn bản năng, tôi đã cố gắng nhảy sang một bên, nhưng không may bên trái tôi là một bức tường, và hai bên phải của tôi là một anh chàng cơ sở 6'4 "rất lớn. của giá đỡ Compaq (những cái có mặt trước bằng lưới mỏng) mà không đặt toàn bộ vào giá đỡ, và không chạm vào anh chàng cơ sở.

21
mrdenny

Tại một số thời điểm trong sự nghiệp của tôi, một cuộc điều tra pháp lý tại công ty tôi đang làm việc đã đặt ra một yêu cầu cho chúng tôi rằng tất cả các email được giữ từ "ngày này" về phía trước, cho đến khi được nói khác đi. Sau khoảng một năm lưu trữ các bản sao lưu đầy đủ hàng ngày của môi trường trao đổi của chúng tôi (1TB mỗi đêm), chúng tôi bắt đầu hết dung lượng.

Các quản trị viên trao đổi đề nghị rằng chúng tôi chỉ giữ mỗi bản sao thứ 8 của email. Để làm điều này, chúng tôi đã cho họ khôi phục cơ sở dữ liệu trao đổi một ngày, trích xuất email họ cần (những người cụ thể được gắn cờ để điều tra) và lưu trữ lại. Họ đã làm điều này cho mỗi ngày thứ 8 của email cho tất cả các bản sao lưu của chúng tôi. Ngày thứ 8 đã được chọn vì trao đổi có một bộ tham số trong đó "các mục đã xóa" được giữ trong cơ sở dữ liệu trong 8 ngày.

Sau khi họ hoàn thành mỗi kho lưu trữ, tôi sẽ quay lại và xóa mọi bản sao lưu cũ hơn những gì họ đã lưu trữ.

TSM không có cách dễ dàng để làm điều này, vì vậy bạn phải xóa thủ công các đối tượng khỏi cơ sở dữ liệu sao lưu.

Tôi đã viết một tập lệnh sẽ xóa tất cả các bản sao lưu cũ hơn một số ngày, bằng cách tính toán ngày bằng cách sử dụng sự khác biệt giữa ngày hôm nay và ngày được đề cập. Vào một ngày nào đó, tôi phải xóa các bản sao lưu trị giá khoảng một tháng, ngoại trừ khi tôi thực hiện phép tính ngày, tôi đã đánh máy và nhập ngày là 7/10/2007 thay vì 6/10/2007 và chạy tập lệnh. Tôi đã xóa toàn bộ dữ liệu trị giá thêm một tháng, vô tình là một phần của vụ kiện rất quan trọng.

Sau đó, tôi đã thêm một số bước vào tập lệnh để xác nhận rằng bạn muốn xóa dữ liệu và cho bạn biết những gì nó sẽ xóa ...

May mắn thay, họ thậm chí không bao giờ sử dụng bất kỳ dữ liệu nào chúng tôi đã làm việc rất chăm chỉ để lưu giữ và tôi vẫn có công việc của mình.

20
WerkkreW

Sau một ngày dài hoặc theo dõi hiệu suất và điều chỉnh một máy tính lớn (bạn biết các con thú mất vài giờ trước khi tất cả các trang web sao lưu dự phòng đã đồng ý rằng nó thực sự được khởi động lại và được đồng bộ hóa hoàn toàn) Tôi kéo dài ngón tay, tắt máy thỏa mãn -p bây giờ trong máy tính xách tay của tôi Nhắc, đóng nắp, rút ​​cáp nối tiếp ra khỏi máy tính lớn, với dự đoán về một ly rượu vang lạnh Nice.

Đột nhiên tôi nghe thấy âm thanh điếc tai khi quay xuống máy tính lớn trong khi máy tính xách tay của tôi vẫn đang vui vẻ hiển thị X.

Trong khi chờ máy hoàn toàn trực tuyến trở lại, tôi quyết định rằng tôi có thời gian để ACPI hoạt động trên máy tính xách tay của mình để tôi không bao giờ bị cám dỗ tắt máy tính xách tay.

20
Martin P. Hellwig

Tôi đã xóa nhầm tài khoản của ai đó, có những cái tên bị lẫn với tên mà tôi muốn xóa. Đối lập

Phần thú vị là họ không bao giờ biết những gì đã xảy ra. Nhận được cuộc gọi mà họ không thể đăng nhập, đồng xu rơi về tài khoản tôi đã xóa.

Trong khi trên điện thoại với họ, tôi đã nhanh chóng tạo lại tài khoản của họ, gắn lại hộp thư cũ của họ vào đó (rất may Exchange không xóa hộp thư ngay lập tức) và quay lại tệp người dùng cũ của họ.

Sau đó, tôi đổ lỗi cho họ vì đã quên mật khẩu của họ mà tôi vừa đặt lại cho họ :)

16
SpaceManSpiff

Vô tình cài đặt một tệp tar.gz trên hộp Gentoo Linux của tôi ở sai vị trí và nó để lại các tệp ở khắp mọi nơi. Điều này phải có vào khoảng năm 1999, 19 tại thời điểm đó (cảm ơn vì những bình luận bên dưới)

Là người đam mê, tôi quyết định tự mình viết kịch bản ra khỏi công việc đi thủ công qua từng tệp.

Vì vậy, tôi đã cố gắng:

tar --list evilevilpackage.tar.gz | xargs rm -rf

Tôi không mất nhiều thời gian để nhận ra rằng tar cũng liệt kê tất cả các thư mục mà chương trình đang sử dụng, những thư mục được bao gồm là ''/usr,/var,/etc '' và một vài thư mục khác mà tôi không thực sự muốn đi.

CTRL-C! CTRL-C! CTRL-C! Quá muộn! Mọi thứ đã qua, cài đặt lại thời gian. May mắn thay, hộp không chứa bất cứ thứ gì quan trọng.

16
Andrioid

Tai nạn này đã không xảy ra ... nhưng nó đáng được đề cập:

Tôi đã được gửi đến một trung tâm dữ liệu được sử dụng nhiều để tiến hành kiểm tra băng thông trên một mạch mới. Tôi đã đến phòng phân chia/IDF, tìm thấy một vị trí trên một trong các giá đỡ cho bộ định tuyến thử nghiệm của tôi, thực hiện các kết nối của tôi và bắt đầu các thử nghiệm. Thật không may, tôi hoàn toàn không nhận thấy bộ định tuyến đường viền trong sản xuất không chỉ chính xác trên giá tiếp theo (gần như ở cùng cấp độ), mà nó cũng là kiểu dáng và mẫu tương tự như bộ định tuyến thử nghiệm của tôi.

Khi thử nghiệm xong, tôi bắt đầu nhấn công tắc nguồn sang vị trí tắt (... hãy tưởng tượng nó đang chuyển động chậm ...) và, tôi thề, ngay khi tôi đang đặt áp lực, tôi nhận ra rằng bộ định tuyến mà tôi sắp sửa để tắt là một trong sản xuất. Trái tim tôi ngừng đập và tôi gần như ... tốt, sử dụng trí tưởng tượng của bạn.

Tôi đã rời khỏi trung tâm dữ liệu MDF trông ma quái và nhợt nhạt, nhưng đồng thời vui mừng vì tôi vẫn có một công việc!

16
l0c0b0x

Là một phần nhỏ trong cuộc sống trước đây của tôi, tôi đã quản lý máy chủ tệp của công ty, một hộp số 4:11. Nó hầu như không cần bất kỳ đầu vào nào, nhưng nếu có, bạn đã mở một cửa sổ điều khiển từ xa.

Được sử dụng để sử dụng DOS mọi lúc, khi tôi hoàn thành, tôi tự nhiên sẽ gõ "Thoát". Đối với Netware, "exit" là lệnh tắt HĐH. May mắn thay, nó sẽ không cho phép bạn tắt máy trừ khi bạn "Xuống" máy chủ trước. (Làm cho nó không khả dụng với mạng/máy khách) Vì vậy, khi bạn gõ "Thoát" trong bảng điều khiển, nó sẽ nói một cách hữu ích, "Trước tiên bạn phải gõ" Xuống "trước khi bạn có thể thoát"

Hỏi tôi bao nhiêu lần tôi 1: gõ "thoát" trong phiên giao diện điều khiển và 2: Nhanh chóng gõ "Xuống" và sau đó "Thoát" để tôi có thể "hoàn thành những gì tôi đang cố gắng làm"

Và rồi điện thoại bắt đầu đổ chuông .....

LOL

12
Bob

Nơi cuối cùng tôi làm việc, đồng nghiệp của tôi đã có con với anh ta trong phòng máy chủ (tại sao? Tôi KHÔNG CÓ Ý TƯỞNG!).

Anh ta đảm bảo rằng họ ở rất xa các máy chủ và giải thích với đứa con 5 tuổi của mình rằng anh ta không nên chạm vào BẤT K of máy chủ nào và ĐẢM BẢO không có công tắc nguồn nào.

Thực tế, anh ta đã có chúng ngay gần cửa ... (bạn có thể thấy nơi này đang diễn ra không ...?)

Cậu bé không chạm vào bất kỳ nút nguồn máy chủ nào ... Không, điều đó hoàn toàn quá dễ để giải thích. Thay vào đó, anh ta chạm vào NÚT ĐỎ LỚN ở gần cửa ... Nút tắt nguồn cho ROOM ENTIRE SERVER !!!

Các đường dây điện thoại ngay lập tức bắt đầu sáng lên tự hỏi tại sao Exchange, Máy chủ tệp, v.v. không có sẵn ... Hãy tưởng tượng bạn đang cố gắng giải thích điều đó với CEO!

-JFV

11
JFV

Một câu chuyện khác đã không xảy ra (phew):

Chúng tôi đã thực hiện sao lưu gia tăng một cách tôn giáo mỗi ngày vào một ổ đĩa băng.

Chúng tôi tình cờ viết một cuộn băng chứa dữ liệu để gửi cho người khác. Họ nói 'chúng tôi không thể đọc băng của bạn'. Trong thực tế, chúng ta cũng không thể. Hoặc bất kỳ băng trong thực tế.

Chúng tôi đã mua một ổ đĩa băng khác và nín thở cho đến khi chúng tôi cài đặt nó.

Đạo đức của câu chuyện. Luôn chắc chắn rằng bạn kiểm tra bản sao lưu của bạn.

11
Matthew Farwell

Tôi đã từng có một cuộc chiến với phần mềm giám sát APC UPS. Là một công ty nhỏ, chúng tôi đã có một vài UPS nhỏ và nhiều máy chủ khác nhau được thiết lập để giám sát chúng. Hầu hết các máy chủ là Linux, nhưng một số ít chạy Windows và vì vậy chúng là những máy chủ được sử dụng vì phần mềm APC chỉ dành cho Windows.

Tuy nhiên, phần mềm APC tại thời điểm đó được mã hóa cứng để giả định rằng UPS mà nó đang nói đến cũng đang cung cấp năng lượng cho PC đang chạy! Đây không phải là trường hợp của máy chủ này, nhưng tôi phát hiện ra rằng đã quá muộn để bảo nó dừng lại. Thật không may, lập trình viên chính đang trình diễn sản phẩm của công ty cho đối tác - đó là một ứng dụng dựa trên web, chạy trên cùng một máy chủ mà tôi không muốn phần mềm APC ngừng hoạt động ...

10
staticsan

Tôi làm việc cho một nhà cung cấp dịch vụ không dây ở Bắc Mỹ và đã thực hiện một số khóa đào tạo cho một người trong nhóm của tôi để thực hiện các đơn đặt hàng làm việc. Tôi đã ở lại vài đêm đầu tiên (chúng tôi làm mọi thứ trong cửa sổ bảo trì), nhưng anh ấy vẫn ổn và nói rằng anh ấy phải tự học, vì vậy tôi đã để anh ấy và bỏ điện thoại di động và nhắn tin. Tôi đăng nhập và kiểm tra cấu hình khi tôi thức dậy lúc 8 giờ sáng hôm sau.

Sự thay đổi là chúng tôi đã thêm một nhóm địa chỉ IP mới cho BlackBerry , nhóm chúng tôi đã thêm là khoảng 10000 địa chỉ. Để thực hiện việc này, chúng tôi thêm các tuyến đường trên bộ định tuyến trỏ đến địa chỉ bộ xử lý trên một lưỡi cắt thực hiện tất cả quá trình xử lý cuộc gọi (về cơ bản nó hoạt động như một proxy). Ngoài ra, chúng tôi đăng nhập vào bộ xử lý và định cấu hình nhóm IP và liên kết nhóm IP sẽ được sử dụng cho người dùng không dây của chúng tôi. Tuy nhiên, để kiểm tra, chúng tôi thường định cấu hình này trên một bộ xử lý (thực sự khởi động điện thoại và kiểm tra tất cả các tính năng), sau đó chỉ cần di chuyển cấu hình sang bộ xử lý thực tế mà chúng tôi muốn.

Nhanh chóng chuyển tiếp hai tuần và tôi nhận được một cuộc gọi từ trung tâm điều khiển của chúng tôi rằng có rất nhiều cuộc gọi liên quan đến một số vấn đề không liên tục của BlackBerry và một vài chiếc BlackBerry mà họ đã xem dường như đang đạp xe qua một bể chung, nhưng không thực sự chắc chắn những gì đã xảy ra. Tôi chỉ mất khoảng 5 phút để nhận ra rằng đây là nhóm mới mà đồng nghiệp của tôi vừa mới thêm hai tuần trước. Cũng không mất nhiều thời gian để thấy rằng bộ định tuyến có hai tuyến trong đó, một đi đến bộ xử lý thử nghiệm và một đi đến bộ xử lý cuộc gọi thích hợp. Đây là những gì nó đã được, anh ta quên xóa tuyến đường đến bộ xử lý thử nghiệm và nó đã thay thế tuyến đường thích hợp.

Về cơ bản, BlackBerry sẽ kết nối với mạng, kết nối với proxy để lấy địa chỉ IP của nó, proxy sẽ cung cấp cho nó một địa chỉ từ nhóm với tuyến không chính xác và BlackBerry sẽ thử và nói chuyện với RIM rơle và phản hồi sẽ được chuyển đến proxy thử nghiệm và không bao giờ gửi lại cho người dùng, về cơ bản có nghĩa là không có kết nối.

Mặc dù vậy, chúng tôi đã may mắn vì BlackBerry có hành vi rằng nếu họ không thể liên lạc với rơle, họ sẽ ngắt kết nối/kết nối lại với mạng, nhưng dù sao một số thiết bị của RIM không có dịch vụ trong vài giờ cho đến khi họ có thể quay vòng hoạt động. hồ bơi. Tôi nghĩ lại, và khi tôi kiểm tra lại công việc, tôi chỉ kiểm tra cấu hình proxy mới của anh chàng này, tôi chưa bao giờ kiểm tra cấu hình định tuyến vì anh chàng này trước đây thuộc nhóm xương sống và việc định tuyến là việc của anh ta. Giáo sư!

Tôi đã sửa nó và gọi anh ấy dậy vào chiều hôm đó, ngày của anh ấy đang diễn ra tốt đẹp, nhưng tôi bắt đầu với tôi xin lỗi, nhưng tôi sắp hủy hoại cả tuần của bạn. Một năm sau câu chuyện vẫn xuất hiện xung quanh các loại bia.

8
Kevin Nisbet

Việc vấp phải một máy chủ tháp được đặt phía sau giá đỡ và đập đầu tôi vào mặt sau của bộ định tuyến chính của Cisco trên đường tôi đi xuống. Do đó, tiết lộ cách thức các dây điện thực sự được đặt trong các bộ nguồn ở mặt trước của Catalyst 65 .

Vâng. Bây giờ chúng ta đã gặp khó khăn trong một cái móc trong phòng máy chủ. Với tên của tôi trên đó.

8
Bill B

Tôi đã cho một sysadmin mới tham quan ứng dụng Trình quản lý dịch vụ. Tôi nói "nếu bạn cần dừng dịch vụ này, bạn sẽ nhấp vào nút này, nhưng bạn không bao giờ nên làm điều đó trong ngày." Bạn sẽ không bao giờ tin rằng nút chuột của cô ấy nhạy cảm như thế nào!

Hai phút sau, dịch vụ đã bắt đầu lại và dường như không ai để ý.

8
Antony

Dì tôi yêu cầu tôi sửa máy tính của họ. Họ nói rằng nó sẽ không khởi động và nó đã như thế trong 2 tuần. Tôi nghi ngờ đó là BIOS hoặc HĐH.

Tôi ngồi xuống trước máy tính của họ. Tôi cúi xuống để nhấn nút nguồn. Tôi nhìn lên.

BIOS đã thông qua. Điều đó thật tốt.

Hệ điều hành đã khởi động. Điều đó thật tốt.

Tôi di chuyển chuột xung quanh nghĩ rằng có thể có vấn đề với các thiết bị đầu vào. Không có vấn đề với các thiết bị đầu vào.

Tôi mở trình xử lý Word của cô ấy. Nó chạy.

Tôi in thử máy in. Nó được in.

Đến lúc này, tôi đứng dậy và nói với dì (người đang theo dõi tôi) rằng máy tính không có gì sai. Cô ấy tuyên bố rằng nó không giống như vậy trước khi tôi ngồi xuống.

Bây giờ tôi có thể khẳng định với gia đình rằng tôi rất tốt, rằng tôi có thể sửa bất kỳ máy tính nào chỉ bằng cách ngồi trước nó.

7
MrValdez

Khi tôi được quản trị viên chính thuê làm sysadmin lần đầu tiên ... trong tuần đầu tiên, chúng tôi đã nhận được một máy chủ Dell hoàn toàn mới ... Windows Server 2003 ... đó là đứa con bé bỏng của anh ấy cho đến khi tôi được gọi bí mật đến phòng máy chủ vào lúc nửa đêm một đêm thứ bảy để dọn sạch nhiều phần mềm độc hại khỏi nó bởi vì anh ấy đã KHẢO SÁT WEB với nó trước khi triển khai MÀ KHÔNG CÒN !!!

Dọn dẹp phần mềm độc hại là điều mà tôi đã có nhiều kinh nghiệm, nhưng vì đây là máy chủ nên tôi đã định dạng và cài đặt lại để an toàn hơn.

Tôi chưa bao giờ nói một lời với anh ấy về nó. Anh ta biết rằng anh ta đã làm rối tung mọi thứ.

7
cop1152

Không chỉ là một thứ kịch bản cá nhân hơn là một thứ quản trị hệ thống, nhưng ...

Tôi đã viết một tập lệnh Perl để hoạt động như một macro sẽ lấy thông tin hiện đang phát từ Banshee và nhập ký tự theo từng ký tự dưới dạng các sự kiện bàn phím bằng chương trình "xte". Bằng cách này, tôi có thể làm cho nó hoạt động trong các chương trình mà không có bất kỳ tương tác đặc biệt nào, nó sẽ giống như tôi đã gõ nó.

Vâng, tôi đã mã hóa điều gần như hoàn hảo. Tôi quyết định thử nghiệm nó trong một số trò chơi ngẫu nhiên. Phím bấm để hiển thị trò chuyện là shift + enter. Bây giờ để làm điều này tôi cần phải giữ nó shift, nhấn enter, rồi thả ra shift. Thật không may trong sự vội vàng của tôi, tôi đã quên "phát hành thay đổi". Tôi đã chạy tập lệnh và điều này dẫn đến hiệu ứng phụ có phần vui nhộn của phím shift của tôi bị khóa. Tôi nghĩ rằng "không có vấn đề gì, tôi sẽ chỉ đi đến thiết bị đầu cuối và nhập thủ công vào dòng để phát hành ca". Thật không may, như mọi người đều biết, Linux rất phân biệt chữ hoa chữ thường. Nó sẽ không chấp nhận lệnh trong tất cả các mũ vì tôi phải nhập nó. Tôi không thể "thay đổi" hoặc bất cứ điều gì như thế.

Điều này dẫn đến một cuộc săn lùng năm phút tôi truy cập các trang web và sử dụng chuột để sao chép + dán các chữ cái viết thường vào thiết bị đầu cuối để tạo thành lệnh tôi cần để tắt nó.

7
DWilliams

Không phải là một vấn đề lớn, nhưng chắc chắn là một 'Quả trứng trên mặt tôi' vào khoảng 10 năm trước. Tôi đã trải qua kiểm kê phần cứng cũ và chụp lại hình ảnh các đĩa đã sẵn sàng để phần cứng được giảm tải. Cố gắng tìm cách hiệu quả nhất có thể để làm điều này, tôi đã xây dựng một CDRom với một bản sao của Norton Ghost và hình ảnh để áp dụng. Bạn cấp nguồn cho máy và trong khi nó đang POST, hãy đặt CD vào ổ đĩa. Máy sẽ tự khởi động CD và tự động hình ảnh lại. Làm việc tốt.

Vấn đề xảy ra khi tôi đã tạo ra các bản sao của đĩa CD để tôi có thể có được nhiều máy hơn song song. Tôi đã ghi xong đĩa CD cuối cùng, tắt máy tính để bàn và về nhà trong ngày. Vâng, bạn có thể đoán những gì đã xảy ra vào sáng hôm sau. Tôi bước vào, bật PC lên và đi pha cà phê ...

Khi tôi quay lại vì một số lý do, máy của tôi đã tắt tên miền và không chấp nhận mật khẩu của tôi ...

Tôi vừa mới biết chuyện gì đã xảy ra và bắt đầu chửi thề khi những người khác đến trong ngày. Đúng, họ đã không cho tôi sống điều đó trong một thời gian.

7
Sam

Ngày trước, khi tôi còn rất xanh, tôi cần cài đặt phần mềm AV trên PC của người dùng, vì dường như không ai có nó. Vì vậy, tôi đã dành một chút thời gian để tìm ra cách thực hiện cài đặt từ xa, thay vì chọc vào khoảng 40 hoặc 50 máy tính để bàn. Cài đặt từ xa chạy hoàn hảo và mọi thứ dường như tốt, cho đến khi các nhà quản lý khác nhau ghé qua văn phòng của tôi để phàn nàn rằng họ không thể đăng nhập.

Hóa ra một vài cá nhân đã cài đặt Symantec AV trên máy của họ và điều này hoàn toàn không cùng tồn tại với phần mềm McAfee mà tôi đang sử dụng và sẽ khóa máy sau khi thử đăng nhập.

May mắn thay, có thể vô hiệu hóa dịch vụ từ xa nếu bạn đã truy cập vào máy trước khi họ cố gắng đăng nhập, vì vậy tôi đã có được điểm để sửa lỗi thay vì phải xây dựng lại tất cả các quản lý cấp cao của PC ...

7
user2278
6
Rook

Được thực hiện bởi một trong những nhân viên của tôi ... Ví dụ hoàn hảo về lý do tại sao bạn dán nhãn rõ ràng cho máy chủ của mình:

Gửi nhân viên của tôi ra colo để xây dựng lại máy chủ cơ sở dữ liệu MSSQL thứ cấp (không có dữ liệu hiện tại trên đó). Chính đã được tích cực sử dụng. Bạn có thể dự đoán phần còn lại của câu chuyện này ... Khi đó, anh ta khởi động lại máy chủ, bắt đầu cài đặt và định dạng lại các ổ đĩa, chỉ để tôi gọi cho anh ta và hỏi anh ta tại sao máy chủ cơ sở dữ liệu chính không còn phản hồi. (doh)

6
skraggy

Của tôi đã xảy ra chỉ 6 tháng trước. Chúng tôi vừa chuyển sang một máy chủ mới cho ứng dụng web PHP/MySQL. Vì tôi phải chọn HĐH, tôi đã chọn một thứ tôi quen thuộc/thoải mái nhất: Ubuntu.

Chúng tôi đã có một số tập lệnh sao lưu sẽ được chạy theo cron hàng giờ, hàng ngày, v.v ... Quá trình chuyển đổi diễn ra hoàn hảo. Chỉ có khoảng 2 phút thời gian ngừng hoạt động trong khi tôi chuyển MySQL DB từ máy chủ cũ sang máy chủ mới và chuyển IP.

Tuy nhiên, một vài tuần sau đó, tôi đã làm việc trong MySQL tại dòng lệnh và đang xóa một số hồ sơ kiểm tra cũ không còn cần thiết nữa. Vì tôi là lập trình viên đầu tiên, sysadmin thứ hai, tôi đã có thói quen gõ dấu chấm phẩy (;) trước rồi gõ lệnh. Chà, khi tôi chuẩn bị thêm mệnh đề WHERE vào truy vấn XÓA của mình, tôi vô tình nhấn phím enter. ...Giáo sư.

Query OK, 649 rows affected (0.00 sec)

"Không có gì to tát cả," tôi nghĩ. "Sao lưu hàng giờ vừa hoàn thành 4 phút trước. Có thể mất tất cả 3 hồ sơ. Tôi nhanh chóng vào thư mục sao lưu và khôi phục. Vấn đề đã được giải quyết.

... Sau đó, tôi nhận thấy dấu thời gian trên bản sao lưu. Đã 17 ngày tuổi. Không có bản sao lưu nào khác. Tôi vừa xóa sạch mọi thứ trong hệ thống đã nhập chưa đầy 17 ngày trước đó.

Hóa ra có một lỗi trong trình nền cron của Ubuntu khiến nó không chạy tệp tập lệnh có dấu chấm (.) Ở bất cứ đâu trong tên. Nó không gây ra lỗi, vì vậy không có bằng chứng về vấn đề. Nó chỉ từ chối chạy nó. Tất cả các tập lệnh sao lưu của chúng tôi có dấu chấm trong tên của họ. Họ đã làm việc hoàn hảo trước đây, nhưng không phải bây giờ.

Bài học tôi đã học:

  1. Đừng đặt dấu chấm phẩy trên dòng lệnh của MySQL cho đến khi bạn thực sự muốn chạy truy vấn.
  2. Kiểm tra dấu thời gian trên các tệp sao lưu của bạn trước khi khôi phục chúng.
  3. Kiểm tra tập lệnh sao lưu của bạn và đảm bảo rằng chúng thực sự hoạt động.
6
Andrew Ensley

Lâu hơn tôi nghĩ, tôi là người kỹ thuật của công ty và làm việc với một số chuyên gia tư vấn cài đặt ứng dụng của họ. Phần cứng là VAX DEC và sử dụng máy chủ lưu trữ HSC50. Các chuyên gia tư vấn mất nhiều thời gian trong ngày với cài đặt của họ và sau khi họ rời đi, tôi quyết định sao lưu đĩa hệ thống vào một đĩa trống bằng cách sử dụng tiện ích sao chép bit-bit-bit của HSC50. Sau khi sao chép xong và tôi cố gắng khởi động lại, tôi phát hiện ra rằng tôi đã đảo ngược tên của đĩa nguồn và đĩa đích, và do đó đã sao lưu đĩa trống từng bit vào đĩa hệ thống.

Tôi đã có thể xây dựng lại VMS trên đĩa hệ thống và cài đặt lại nhiều ứng dụng, nhưng tôi nghĩ nó không bao giờ hoạt động tốt như vậy. Kể từ đó, nếu tôi đang thực hiện sao chép/sao lưu/v.v., tôi sẽ ghi bảo vệ đĩa nguồn trước khi tiếp tục. (Bây giờ các công tắc chống ghi không còn nữa, tôi nhìn vào lệnh trước Tôi nhấn Return.)

6
JonP

Tôi đã được gọi để điều tra một cảnh báo đến từ một máy Windows cho biết hệ thống giám sát không có tệp giấy phép. Tôi đã mở lệnh Prompt và bắt đầu điều tra vấn đề và thấy rằng các lệnh windows cơ bản thậm chí không có ở đó.

Một sysadmin đã chạy một tập lệnh từ xa đã viết một tập lệnh sử dụng lệnh del để xóa một thư mục được chỉ định bởi một thư mục gốc và thư mục con với các thư mục được chỉ định trong Biến môi trường. Nếu Biến môi trường không được đặt, nó sẽ âm thầm xóa toàn bộ phân vùng.

Khi được nói, sysadmin đã rất ngạc nhiên khi họ xác nhận hành động bằng cách chạy đoạn script đã nói trên cuốn sổ tay của chính họ, do đó cũng vứt nó đi.

Điều tuyệt vời là Windows đã chạy tốt, cho đến khi chúng tôi khởi động lại máy chủ. Chỉ có phần mềm giám sát keo kiệt phàn nàn.

Đó là máy chủ Active Directory thứ cấp cho một đảng chính trị. Giáo sư.

5
Stuart Woodward

Thêm quy tắc bỏ qua vào tường lửa để tăng tốc một số tải xuống BitTorrent. Hóa ra hệ thống quy tắc bỏ qua được sử dụng không quá ổn định và nó đã phá hủy tường lửa. Đây là một tường lửa biên giới cho kết nối Internet của mọi trường học trong thành phố. Để làm cho vấn đề tồi tệ hơn, việc khởi động lại chỉ đủ để khiến ổ cứng của tường lửa bị chết. Vui? Không nhiều lắm. Thất bại ngoạn mục? Chắc chắn rồi.

4
Mark

Của tôi là một nỗ lực nhóm thẻ.

Tôi được ban quản lý hướng dẫn đăng nhập một trong những DBA của chúng tôi vào máy chủ để anh ta có thể dọn dẹp. Anh ta chạy truy vấn của mình và ngay lập tức cả hai máy nhắn tin của chúng tôi đều tắt, điều này đã thúc đẩy cả hai chúng tôi.

Hóa ra, việc dọn dẹp thực sự là một cơ sở dữ liệu bị rơi và được cho là sẽ được thực hiện trên một trong các máy chủ phát triển. Tuy nhiên, những chỉ dẫn mà tôi nhận được đã khiến tôi tin rằng đây là một nhiệm vụ dọn dẹp nhỏ đáng lẽ phải xảy ra trong sản xuất.

May mắn thay, chúng tôi đã có thể khôi phục từ bản sao lưu với mất dữ liệu tối thiểu.

Bài học rút ra: Hãy chắc chắn rằng bạn LUÔN LUÔN biết CHÍNH XÁC những gì bạn phải làm khi làm hỏng máy chủ sản xuất. Nếu có sự không chắc chắn, tốt nhất bạn nên nhận được sự chấp nhận.

4
Bill B

Đồng ý. Để có được & trên bàn phím Hoa Kỳ, nhấn Shift-7. Để lấy nó trên bàn phím Thụy Điển, nhấn Shift-6. Vậy, bạn nhận được gì khi nhấn Shift-7 trên bàn phím Thụy Điển? Bạn lấy /.

Nhiều năm trước bố cục của Thụy Điển không phải là phổ biến. Sở thích cá nhân của tôi là sử dụng bố cục của Mỹ. Một ngày nọ tôi muốn xóa một loạt các tập tin và thư mục con trong một thư mục.

Tôi đánh:

rm -fr *

Nhưng là quá chậm, vì vậy tôi nhanh chóng nhấn:

Ctrl-C rm -fr * &

Hay là tôi? Vâng, tôi đã không làm. Phải mất vài giây tôi mới nhận ra mình đang ở trên bàn phím Thụy Điển. Xem ở trên để giải mã những gì đã xảy ra. Và thảm họa đó là một sự thật.

Đó là ngày tôi học lệnh:

dd

Tôi đã xoay sở để có được cơ bản từ đĩa đến băng, chỉ có điều nó mất cả đêm. Ngày hôm sau tôi biết rằng hệ thống sắp được cài đặt lại.

Tôi đã may mắn, nhưng tôi đã học được một vài điều.

4
fredarin

Khi hầu hết các đội máy chủ vẫn là Windows NT, phương thức từ xa chính được sử dụng là pcAnywhere. Chúng tôi đã có một lỗi "nổi tiếng", đôi khi các máy chủ sẽ đột nhiên khởi động lại khi sử dụng pcAnywhere và người dùng cuối được thông báo về lỗi nổi tiếng này.

Lỗi là pcAnywhere (ít nhất là bất kỳ phiên bản nào chúng tôi đang sử dụng) đều có nút "khởi động lại máy chủ" bên cạnh nút "ngắt kết nối khỏi máy chủ". Vì vậy, thỉnh thoảng ...: D

4
marty

VNC'd thành Win 2k server 200 dặm, đi thêm một địa chỉ IP, nhấp chuột như vậy ... phải vào biểu tượng mạng trong khay hệ thống, nhấp 'Tắt' không 'Properties' - DOH .... Giải pháp! .... Lên xe. Không vui! Nếu chỉ họ có một 'bạn chắc chắn' trên tùy chọn menu đó!

Mike

4
Mike McClelland

Mùa hè 2002.

Tôi đã vô tình triển khai IE 6.0 với việc khởi động lại bắt buộc tới 16.000 người dùng vào giữa ngày.

Trong thực tế, tôi đã bắt lỗi và gõ nhanh nhất từ ​​trước đến nay odadmin tắt tất cả (Lệnh Tivoli dừng tất cả các máy chủ triển khai).

3
Shawn Anderson

Trên Linux và FreeBSD hostname -s sẽ "Hiển thị tên Máy chủ ngắn. Đây là tên Máy chủ được cắt ở dấu chấm đầu tiên".

Trên Solaris 9, hostname -s sẽ đặt tên máy chủ thành '-s'.

Vì vậy, quản trị viên đồng nghiệp của tôi đã chạy một kịch bản để kiểm tra tất cả 120 hệ thống của chúng tôi, bao gồm 10 máy chủ Cơ sở dữ liệu Oracle quan trọng đang chạy trên Solaris 9.

for Host in `cat all-hosts`; do
ssh $Host "hostname -s"
done

Tất cả các máy chủ Oracle của chúng tôi đã thất bại ngay lập tức. Tốc độ của thất bại này thực sự khá đáng kinh ngạc, Mất khoảng 20 giây để chúng tôi phục hồi từ sai lầm này, nhưng đã quá muộn. Mọi thứ đã sụp đổ.

Điều trớ trêu là trung tâm dữ liệu của chúng tôi bị sự cố mất điện lớn chỉ vài ngày trước đó và chúng tôi đã cập nhật bảng tính "tắt nguồn/bật nguồn" để đảm bảo phục hồi nhanh hơn cho bất kỳ sự cố mất điện nào trong tương lai.

3
Stefan Lasiewski

Không phải tôi, mà là người mà tôi làm việc cùng. Họ đã tạo một chính sách trên máy chủ AV có chứa * trong trường quy trình. Theo thuật ngữ của giáo dân: không cho phép đọc, viết, thực thi bất kỳ quy trình nào có chứa tên *.

Chính sách này sau đó được nhân rộng lên 1.500 máy chủ, lần lượt tắt RDP và bất kỳ quy trình nào khác. Để khắc phục, nó có nghĩa là gắn từng ổ cứng máy chủ từng cái một và xóa chính sách. 48 giờ với đội 15 người.

3
stuart Brand

Tôi là một lập trình viên, vì vậy tất cả các lỗi của tôi thuộc về Stack Overflow. Tuy nhiên, dưới đây là một số lỗi quản trị hệ thống tôi đã chứng kiến.

  1. Thu hồi quyền đăng nhập từ TẤT CẢ người dùng trên miền Windows NT. (Khác với quản trị viên dựng sẵn trên PDC, thật đáng buồn là chỉ có nhà thầu thiết lập tên miền mới biết mật khẩu và họ đã mất từ ​​lâu) Tôi thực sự không biết làm thế nào đạt được điều này. Tôi biết rằng tôi đã ngồi và trò chuyện với các nhà phát triển đồng nghiệp của tôi trong vài giờ.

  2. Vô tình xóa Máy chủ thành viên OU . Đó là một vài giờ trò chuyện trong khi khôi phục từ băng đã được thực hiện.

  3. Quản trị viên của chúng tôi dự định cấp cho tất cả quản trị viên tên miền quyền sử dụng quyền truy cập ổ đĩa CD & đĩa mềm. (Chúng tôi đã sử dụng SecureNT để kiểm soát quyền truy cập vào phương tiện lưu động vào thời điểm đó.) Đáng buồn là anh ấy đã trở thành thành viên nhóm ngược lại và thay vào đó cũng cung cấp cho tất cả người dùng quyền quản trị viên tên miền có thể tháo rời. Tôi đã tìm thấy điều này bởi vì một số bảng xuất hiện trong cơ sở dữ liệu SQL sản xuất được tạo bởi người dùng không nên có thể. Khi tôi nói với quản trị viên trong câu hỏi, tôi rất thích xem khuôn mặt của anh ấy thay đổi từ, không, đó là cách đúng đắn, xuống tới, oh ****. Rất may không có tác hại nghiêm trọng.

3
pipTheGeek

Ha, tai nạn thực sự lớn đầu tiên của tôi là khi tôi đang viết một bảng quản trị SVN nhỏ trên máy chủ phát triển của chúng tôi, phần mềm hoàn toàn không an toàn chỉ được sử dụng để cập nhật trang web "Phát triển" nội bộ.

Đôi khi repo SVN sẽ bị hỏng nên tôi đã viết một nút gọi tệp PHP, sẽ xóa toàn bộ thư mục SVN được yêu cầu và trông giống như thế này ..

<?php
$directory=$_GET['dir'];
$result = Shell_exec("Sudo rm -Rvf /".$direcory);
echo $result;
?>

Đối với những người không nhìn thấy nó - tôi đã viết sai "thư mục $" trong Shell_exec, khiến hệ thống chạy "Sudo rm -Rvf /" .... Lúc đầu, tôi nghĩ rằng trang web chỉ mất thời gian để xóa tất cả các tập tin trong repo. Sau khoảng 10 - 15 phút tôi đã phát hiện ra mình đã phá hủy hơn 1/2 hệ thống tập tin.

Giáo sư.

2
grufftech

Câu chuyện sử dụng lao động trước đây thật tuyệt. Một số chi tiết được thay đổi để bảo vệ người vô tội. Tôi có một vấn đề về sự đồng cảm, gọi anh ta là Fred, người đã có rất nhiều vấn đề về năng suất, nhưng dường như đã chuộc lại chính mình và đã kiếm lại được một số đặc quyền. Vấn đề duy nhất là, khi các đặc quyền của anh ta được khôi phục, một lỗi trong tập lệnh cung cấp đã cho anh ta một số đặc quyền bổ sung.

Tôi đang ở giữa một dự án lớn, vì vậy tôi đã yêu cầu Fred đóng gói một hotfix Windows cần thiết cho một ứng dụng. (Đó là vào thời kỳ tiền blaster khi mọi người không vá một cách tôn giáo như ngày nay). Vì vậy, Fred chạy thử nghiệm trong phòng thí nghiệm của chúng tôi và mọi thứ đều hoạt động tốt.

Fred sau đó hỏi một vài câu hỏi:

"Who should I Push it to?" (Mind you, this is a patch for some custom VB app)

"Everyone", I respond

"Ok, what time should it start?"

"How about 2AM?", I answer. (Figuring I'd have time to look over everything before I left for the day!)

Vậy chuyện gì xảy ra tiếp theo? Anh ta thiết lập một công việc với ứng dụng phân phối phần mềm của chúng tôi để Đẩy cho mọi người, và thậm chí đủ tử tế để kiểm tra các hộp cho mọi nền tảng mà sản phẩm hỗ trợ. Sau đó, đặt thời gian bắt đầu cho 2AM, như trong 2AM diễn ra khoảng 12 giờ trước.

Kết quả? Mọi thứ khởi động lại và trys để cài đặt một số bản vá thời gian chạy VB5. Vào khoảng 2:45 PM vào chiều thứ Sáu. Mọi thứ.

Mọi điều? Giống như 40.000 PC? Đúng. 3.000 máy chủ Windows? Đúng. 300 hộp HP, Sun và IBM Unix? Đúng. Một cụm AS/400? Đúng.

Điều duy nhất không khởi động lại là Windows DC, vì những người AD đã vô hiệu hóa ứng dụng của chúng tôi vì một số lý do. Cơn ác mộng thần thánh. Sau một tuần lau dọn, tôi không thể tin rằng mình vẫn được tuyển dụng.

Cú đấm? Fred có một sự thăng tiến lớn trong công việc mà anh ta không thể làm tổn thương gì thêm nữa.

2
duffbeer703

Có lẽ nhiều hơn một đêm rắm não hơn bất cứ điều gì khác.

Một trong những nhà phát triển đã gặp sự cố khi chạy a Java profiler trên hộp Solaris. Trình hồ sơ đã phàn nàn rằng có hai bản sao của Libc; một trong /lib và một trong /usr/lib. Vì vậy, sau một vài lds, chúng tôi đã chuyển cái từ /lib vì mọi thứ đều chỉ vào /usr/lib, hoặc vì vậy họ nói.

Nhưng đột nhiên không có gì làm việc. Không ls, không cd, không cp hoặc mv. Sau khoảng 20 phút 'oh crap, oh crap', chúng tôi đã phát hiện ra rằng một trong những nhà phát triển đã có một bản sao Emacs đang chạy trên hộp đó và chúng tôi đã có thể mở bản sao lưu /lib bản sao của Libc và viết lại với tên gốc. Và Voila! Tất cả mọi thứ đã làm việc. Bài học kinh nghiệm; rời khỏi Libc nơi nó muốn và đừng thay đổi yêu cầu của nhà phát triển vào lúc 2 giờ sáng!

2
beggs

Tôi đã có một cái cách đây không lâu. Trong một số triển khai Oracle ODBC cầu, tôi đã phải sửa đổi đường dẫn trên khoảng 500 bài đăng của người dùng.

Đó là một hoạt động khá đơn giản, thực sự. Quá tệ, tôi quên mất những trích dẫn đó. Mọi người bắt đầu đổ chuông sau khi họ có một số tin nhắn bị cắt xén kỳ lạ (ODBC cài đặt không thành công) và dường như nghĩ rằng việc khởi động lại máy sẽ chỉ là wat cần thiết.

Tất nhiên, một số cài đặt trước khác đã CHUẨN BỊ (!!!) một số đường dẫn tệp chương trình trong biến hệ thống (có dấu cách và tất cả, không có dấu ngoặc kép), vì vậy đường dẫn mới dừng ở đó, tại c:\Chương trình (tất nhiên, sự tồn tại của% ProgramFiles% vẫn hoàn toàn bị bỏ qua). Không có hệ thống, không có hệ thống32, không có Shell. Vì vậy, không có kịch bản đăng nhập.

Những người khởi động lại không có quyền truy cập mạng nữa và không có tập lệnh tự động nào có thể sửa chữa thiệt hại. Tất nhiên, ngay khi tôi đến một số người dùng phàn nàn, nhìn xung quanh và kiểm tra đường dẫn, tôi đã nhận được điều đó .. cảm giác chìm.

Trong khoảng 30 phút, tôi đã có một tập lệnh khác, với các giá trị đường dẫn chuẩn nhất, sẵn sàng để được gửi đến mọi người (e-mail vẫn hoạt động). Người dùng thậm chí đã gọi lại để chắc chắn rằng bản vá là có thật, vì họ không được sử dụng để gửi exe mật mã với những lý do kỳ lạ để áp dụng chúng, và hầu hết trong số họ thậm chí không biết chuyện gì đang xảy ra.

Phiên bản đầu tiên rất lộn xộn (một dấu chấm phẩy mới ở mỗi lần thực thi), nhưng nó đã ghi lại mọi giá trị đường dẫn có thể có, vì vậy tôi nhanh chóng có dữ liệu với các đường dẫn có thể, vì vậy tôi chỉ cần tạo ra thứ gì đó thông minh để kiểm tra tất cả, kết thúc đường dẫn độc đáo tại chỗ.

Nói chung, nó chỉ kéo dài khoảng 45 phút, và tôi may mắn là người đưa mọi thứ trở lại ổn thỏa. Nhưng vẫn vậy, khi một con đường bị hỏng hiện ra, tôi vẫn sẵn sàng nhận lỗi;)

2
Berzemus

Máy chủ tốt nhất của tôi xuất hiện vào thời điểm máy chủ dự phòng của chúng tôi ở trong tình trạng khập khiễng hành chính - ông chủ của tôi đang "tranh luận" liệu có nên ở lại văn phòng hay không, ngoài phòng máy chủ của chúng tôi (và không thực hiện sao lưu vì lý do nào đó) nó nên được cài đặt trong phòng máy chủ để tiết kiệm lượng băng thông lớn. Tôi dường như nhớ lại rằng trạng thái lấp lửng này đã tồn tại trong vài tháng.

Máy chủ web của chúng tôi có một mảng RAID 5 để lưu trữ các trang web. Có vẻ như nó đã chạy ở chế độ xuống cấp (mà không thông báo cho tôi vì những lý do chưa biết hoặc tôi không thể nhớ) trong một thời gian trước khi lần thứ hai trong ba ổ đĩa bị hỏng. Tôi phải kéo một máy chủ hoàn toàn gọn gàng hơn. Khách hàng của chúng tôi không hài lòng vì trang web của họ đã biến mất và họ cần khôi phục từ bản sao lưu của chính họ. Đặc biệt là những người không có bản sao lưu riêng của họ.

Những câu hỏi mà sếp tôi hỏi tôi là "Làm thế nào một mảng RAID có thể thất bại như vậy? Tôi nghĩ rằng họ không được phép!" và "Tại sao chúng tôi không có bản sao lưu của máy chủ web?"

Tuy nhiên, bài học đã không đi đến đâu. Sếp của tôi đã hợp tác khi tôi đề nghị rằng việc nâng cấp lên máy chủ thư của chúng tôi nên bao gồm một mảng RAID 1 với một phụ tùng nóng (thay vì tranh cãi với tôi về chi phí thêm, điều mà anh ấy thường làm). Và tất nhiên, máy chủ dự phòng đã thực hiện đúng công việc của mình theo thứ tự ngắn.

2
Ernie

Làm thế nào về việc tìm hiểu sự khác biệt giữa tính năng "Xóa hộp thư" của Exchange Server 2007 và "Vô hiệu hóa hộp thư"? Đặc biệt là khi tôi xóa hộp thư cũ của mọi người để xử lý cơ sở dữ liệu bị hỏng?

...

Khôi phục trên một máy chủ trao đổi ... không vui ... Phải khôi phục máy chủ trao đổi VÀ Active Directory ... gấp đôi không vui.

Làm điều đó lúc 11:00 sáng thứ Sáu ... Vô giá.

2
IceMage

Tôi đã cố gắng giải phóng một số dung lượng trên phân vùng chính của máy chủ web RedHat 5 của trang web. Tôi còn khá mới với Linux nhưng đã sử dụng DOS từ lâu.

Tôi quản lý để di chuyển toàn bộ thư mục/bin sang một phân vùng khác, lấy ra trang web sản xuất và để lại cho mình mà không có bất kỳ lệnh hệ thống có thể truy cập nào. Tôi bối rối, tôi không thể đổi tên, sao chép, di chuyển, bất cứ điều gì vì tôi đã chuyển tất cả những thực thi hữu ích đó.

Rất may, tôi đã có thể sử dụng đĩa khởi động và hoàn tác công việc của mình.

2
Darth Continent

Tôi mới sử dụng RAID 5 và vẫn đang tìm hiểu về cách thức hoạt động của nó. Lúc đó tôi là anh chàng IT duy nhất trong một công ty rất nhỏ. Tất cả các tệp mọi người truy cập được lưu trữ chỉ trên một máy chủ. Máy chủ đang bị thiếu dung lượng và chỉ có 3 ổ đĩa trong mảng RAID, vì vậy tôi nghĩ rằng việc thêm vào thứ 4 sẽ tăng không gian và khả năng phản hồi. Tôi đã làm điều này trong giờ làm việc. Tôi đã không học được khái niệm về bảo trì sau giờ làm việc.

Mảng bắt đầu xây dựng lại, và nó nói rằng nó sẽ được thực hiện trong 36 giờ. Tôi nghĩ rằng đó là cách quá dài. Tôi tìm thấy một thanh trượt kiểm soát ưu tiên xây dựng lại và nó được đặt ở cài đặt thấp nhất. Tôi đặt nó ở mức trung bình. Thời gian đã giảm xuống còn 8 giờ. Đèn ổ cứng nhấp nháy nhanh hơn một chút, nhưng tôi vẫn nghĩ rằng nó vẫn còn quá dài cho chỉ 80GB dữ liệu. Vì vậy, tôi đặt ưu tiên lên cao. Đèn ổ cứng bật sáng và tôi nghĩ "nó giống như thế hơn!" Sau đó, GUI tôi đang sử dụng đã dừng đáp ứng. Nó kết nối với hộp từ xa. Tôi đã cố gắng mang nó trở lại, nhưng nó không thể tìm thấy máy chủ.

Tôi bắt đầu nghe mọi người xuống sảnh phàn nàn rằng họ không thể truy cập máy chủ. Tôi đã đến máy chủ để đăng nhập để xem những gì đang xảy ra. Phải mất 5 phút để màn hình trống chuyển sang nền. Phải mất thêm 5 phút trước khi thông báo đăng nhập xuất hiện. Mỗi lần bấm phím mất 5 phút để đăng ký. Tôi đã đặt mức độ ưu tiên cao đến mức máy chủ sẽ không phản hồi bất cứ điều gì. Phải mất 2 giờ để mảng xây dựng lại. May mắn thay, đó là một giờ trước bữa trưa, vì vậy không ai thực sự quan tâm đến thế. Người quản lý của tôi lúc đó là một phụ nữ thực sự tuyệt vời và nói rằng đó không phải là vấn đề lớn. Các kỹ sư thiết kế đầu đã cho tôi một cái nhìn có ý nghĩa mặc dù. Tôi đã đổ mồ hôi đạn trong 2 giờ. Bài học kinh nghiệm.

2
Joseph

Tôi đã có một nhân viên phàn nàn rằng máy tính xách tay của anh ta bị chậm, vì vậy tôi đã kiểm tra sự phân mảnh ổ cứng và đó là (và cho đến ngày nay) là điều tồi tệ nhất tôi từng thấy. Nỗ lực chống phân mảnh ổ đĩa không có kết quả vì không có đủ không gian trống. Tôi đã cố gắng dọn sạch các tệp tạm thời (không chắc tại sao tôi không tạm thời chuyển công cụ đến máy chủ) và ngu ngốc xóa toàn bộ Outlook.pst của mình vì nghĩ rằng đó là bản sao lưu e-mail của anh ấy chứ không phải e-mail thực sự của anh ấy. Anh tha thứ cho tôi, nhưng không bao giờ để tôi quên nó.

(Điều này đã xảy ra nhiều năm trước ngay sau khi tôi tốt nghiệp đại học. Bây giờ tôi có năng lực hơn nhiều.)

2
Scott

Sai lầm rất ngu ngốc. Tôi đã viết một tập lệnh trên máy trạm Linux của tôi để xử lý một số tệp, nhưng nó không quan trọng là loại tệp nào, miễn là nó có rất nhiều tệp. Vì vậy, tôi quyết định đó là một ý tưởng tốt để sao chép /etc vào thư mục tôi đang thực hiện các bài kiểm tra của mình. Khi gặp sự cố, tôi đã xóa bản sao và sao chép /etc vào thư mục thử nghiệm của tôi một lần nữa. Điều đó đã diễn ra tốt đẹp, trong một thời gian, và sau đó tôi đã gõ

rm -rf /etc 

thay vì

rm -rf etc/  

OK, không có gì phải lo lắng, tôi vẫn có thể làm mọi thứ trên máy trạm của mình và nghĩ rằng tôi có thể hồi sinh nó bằng cách sao chép nó từ một máy trạm khác, hoặc một cái gì đó. Hoặc, cài đặt lại vào cuối ngày. Đầu tiên, lấy thứ gì đó để uống, và vì chính sách của công ty, tôi đã khóa màn hình của mình. Chết tiệt, tôi cần mật khẩu của mình để mở khóa và đó là trong/etc/.....

Sai lầm ngu ngốc:

  • làm quá nhiều root (tôi có lý do chính đáng cho nó O :)).
  • đánh máy /etc thay vì etc/
  • sử dụng /etc cho mục đích thử nghiệm
2
blauwblaatje

Có lần tôi vô tình xóa người dùng "bin" trên hộp Unix. Tất nhiên, việc xóa một người dùng cũng khiến thư mục chính của nó bị xóa.

Bạn có thể đoán thư mục nhà của bin là gì không?

/thùng rác

1
Barry Brown

Một vài công ty trước đây chúng tôi đã có một hộp Windows NT 4 là máy chủ chính chạy mọi thứ, như một bản sao lưu, nó có một ổ cứng được nhân đôi.

Tôi đã vô tình xóa một vài tệp quan trọng, không có vấn đề gì chỉ cần khởi động lại hộp, chọn đĩa 2 từ menu SCSI và chúng tôi sẽ sao lưu và chạy trên bản sao trong vòng một phút.

Sau đó, tôi bắt đầu lệnh để xây dựng lại ổ đĩa gương. Hóa ra, mặc dù Windows hiện đã có C: và D: mới, phần mềm phản chiếu thông minh sẽ không bị đánh lừa bởi điều đó. Nó đã sử dụng số ID SCSI cho nguồn và đích và sao chép vui vẻ 1-> 2.

Cảm ơn bạn Adaptec!

1
Martin Beckett

Cuối tuần, mọi người gần như ra khỏi tòa nhà, tôi vào phòng máy chủ để tải băng mới vào autochanger, để dự phòng đầy đủ vào cuối tuần. AC quá lạnh tôi nghĩ, và tắt nó đi (phòng máy chủ chỉ là một căn phòng có AC treo tường - không có tiền cho bất cứ điều gì nghiêm trọng). Vì vậy, tôi tải lên các băng, đảm bảo TBU đọc mã vạch OK, và đi ra ngoài.

Ngày hôm sau, tôi thức dậy vào buổi sáng, với một cơn nôn nao (này, cuối tuần rồi!), Nhìn vào điện thoại của tôi và thấy một bó SMS tin nhắn "$ server đi xuống". một cái khác "UPS chính đi xuống".

Tôi lấy chìa khóa, lái xe đến văn phòng và mở phòng máy chủ, để tìm khoảng 60c trong đó, và tất cả các thiết bị đều tắt.

Cuối cùng tôi đã kéo một vài người hâm mộ để đẩy không khí nóng ra ngoài, trước khi tôi thậm chí có thể bắt đầu AC hoạt động, chưa kể đến UPS và hơn 40 máy chủ và thiết bị comms. Và dành cuối tuần trong văn phòng tất nhiên. Và cảm ơn tất cả các vị thần cho các đơn vị UPS thông minh có thể kéo mọi thứ xuống một cách độc đáo nếu nhiệt độ xung quanh quá cao. Tôi luôn luôn giữ một chiếc áo hoodie xung quanh và không bao giờ tắt AC

1
dyasny

Mười năm, cộng với nhiều năm trước tôi đã làm việc trong một dự án cần có proxy SOCKS. Tôi đã sử dụng một chương trình có tên WinGate, ngoài SOCKS proxy, còn cung cấp chức năng cổng Internet nhỏ xinh với NAT, DHCP và một vài chi tiết khác. Đây là trước khi Windows có chia sẻ kết nối Internet, vì vậy WinGate cho phép bạn chia sẻ modem quay số với mạng Ethernet của mình.

Tôi đã cài đặt phần mềm và bắt đầu làm việc với chức năng máy khách SOCKS. Cuối ngày hôm đó, chúng tôi mất kết nối internet. Đột nhiên, nó chỉ dừng lại và không ai có thể truy cập bên ngoài công ty. Chúng tôi đã gọi cho ISP của chúng tôi và mọi thứ đều ổn trên kết nối. Các bộ định tuyến đã hoạt động tốt. Chúng tôi không thể tìm ra những gì đã sai. Tôi đã tham gia vào một thời điểm khi tôi có một số kiến ​​thức về TCP/IP, nhưng tôi đã không thực hiện bất kỳ bước tiến nào.

Ngày hôm sau, anh chàng IT của chúng tôi phát hiện ra rằng máy chủ DHCP đã cung cấp địa chỉ của bộ định tuyến cho máy của ai đó và mọi người đang sử dụng nó cho cổng mặc định không đi đến đâu. Cuối ngày hôm đó, anh chàng IT của chúng tôi đến văn phòng của tôi và tôi hỏi: "Vậy bạn có tìm ra ai đã cung cấp sai địa chỉ IP không?" Anh ta nói, "Vâng, đó là bạn!"

WinGate đã mặc định chạy máy chủ DHCP và đã cung cấp địa chỉ bộ định tuyến cho máy khách đầu tiên có địa chỉ trước đó đã hết hạn. Tôi đã khá đỏ mặt trong một thời gian.

1
David Smith

Ngay từ khi còn nhỏ, tôi đã cố gắng 'hữu ích' và cố gắng sao chép 250 MB dữ liệu trên một dòng 128 kbit/s sang 86 trang web khác nhau cùng một lúc ... trong giờ làm việc. Trong khi tôi đang làm điều này, tôi tình cờ nghe mọi người hỏi tại sao mọi thứ lại mất nhiều thời gian như vậy.

Không cần phải nói, tôi đã giết các giao dịch, và (may mắn thay) không ai biết đó là tôi!

1
JFV

Chúng tôi đã xây dựng các hệ thống IVR chìa khóa trao tay cho khách hàng trên các hộp Unix. Một lần, các nhà phát triển có tất cả mã của họ trong/devel. Họ yêu cầu tôi loại bỏ các thư mục phát triển và hộp và đưa các máy chủ đến sân bay vào một chiều chủ nhật (ngày nghỉ của tôi!). Trong lúc vội vàng, tôi đã xóa/dev/*. Ngay lập tức nhìn thấy sai lầm của tôi, ngồi và suy nghĩ trong một phút. Không chắc hệ thống có chết không nếu kernel không có móc nối với các thiết bị hệ thống, vì vậy tôi đã xem thư mục/dev trên một máy giống hệt và theo thứ tự mknod [c | b] chính để khôi phục ổ đĩa bàn phím, tty, scsi, fd0 và null sau đó tạo một đĩa mềm trên máy/dev khác và gắn và sao chép nó cục bộ để lấy phần còn lại.

Vẫn không biết chuyện gì sẽ xảy ra nếu tôi để mọi thứ một mình, nhưng tôi khá chắc chắn rằng nó sẽ không vui khi khởi động lại :)

Bài học kinh nghiệm - thư mục phát triển không được gọi/devel.

1
schemathings

Điều này xảy ra khi tôi mới bắt đầu công việc hỗ trợ đầu tiên của mình ngoài uni, tôi đã kết nối với máy chủ 2003 của khách hàng để cố gắng truy cập vào một trong các máy của người dùng sau khi họ phàn nàn về các vấn đề kết nối.

Nói chuyện với cô ấy thông qua một số khắc phục sự cố cơ bản và nhận thấy cô ấy có IP tĩnh nên bắt đầu nói chuyện với cô ấy thông qua cài đặt này thành DHCP. Tôi đã mở các thuộc tính trên kết nối mạng LAN trên máy chủ để sử dụng trong khi tôi nói với cô ấy về những việc cần làm. Sau khi khiến cô ấy thử và đặt nó trở lại DHCP, nó vẫn có một IP tĩnh nên yêu cầu cô ấy tắt kết nối và kích hoạt lại.

Lúc này, tôi đang làm mọi thứ tôi đang nói với cô ấy trên máy chủ mà không thực sự thay đổi bất kỳ cài đặt nào, cho đến khi tôi yêu cầu cô ấy nhấp chuột phải vào kết nối LAN và nhấn vô hiệu hóa mà sau đó tôi cũng tiến hành.

Mất nửa giây để nhận ra những gì tôi vừa làm.

Có lẽ mất 10 phút để các kỹ sư khác ngừng cười với tôi trước khi một trong số họ phải lái xe trong một giờ để kích hoạt lại NIC tại trang web của khách hàng.

1
Darren Mac

Tôi đã từng chăm sóc một loạt các máy chủ cơ sở dữ liệu, mỗi máy chủ có một chu trình phát triển và thử nghiệm được xác định rõ. Vai trò của chúng tôi là đưa các thay đổi mà các nhà phát triển cung cấp, sử dụng tài liệu của họ từ môi trường thử nghiệm của họ vào môi trường thử nghiệm của khách hàng để thử nghiệm khách hàng trước khi đi vào hoạt động. Là một phần trong đó môi trường kiểm tra khách hàng được xây dựng từ bản sao lưu gần đây nhất của môi trường sống.

Tất cả điều này đã được ghi lại gọn gàng, cùng với quá trình đưa sự thay đổi vào môi trường sống sau khi khách hàng đã ký vào thay đổi.

Chúng tôi đã có một khởi đầu mới trong đội của mình và sau khi anh ấy ở với chúng tôi vài tháng, chúng tôi đã cho anh ấy ngồi vào một số chu kỳ thay đổi cho đến một đêm định mệnh, chúng tôi để anh ấy tự làm điều đó. Việc kiểm tra khách hàng diễn ra suôn sẻ và khách hàng vui vẻ ký vào thay đổi.

Sự khởi đầu mới sau đó đã làm chính xác những gì anh ấy đã làm mỗi lần anh ấy thay đổi môi trường thử nghiệm, tự tin rằng anh ấy không cần phải làm theo tài liệu mà những người còn lại đã làm. Bước (1), xây dựng lại từ bản sao lưu trước ...

Sáng hôm sau, khách hàng nhận thấy rằng công việc của ngày hôm trước đã bị mất và chúng tôi không mất nhiều thời gian để tìm hiểu chuyện gì đã xảy ra. May mắn thay, cơ sở dữ liệu đã thay đổi đăng nhập để chúng tôi có thể khôi phục tất cả các hoạt động. Sự khởi đầu mới ít nhất là học cách coi trọng tài liệu và theo dõi nó trong tương lai.

1
Cry Havok

Tôi đã có một cái mới tốt xảy ra với tôi tuần trước.

Tôi đã có một trong những người của tôi xây dựng một máy chủ DNS tạm thời cho một nền tảng thử nghiệm mà chúng tôi đang xây dựng, tôi đã yêu cầu các nhân viên DNS của chúng tôi cập nhật một miền thử nghiệm cụ thể để trỏ đến máy chủ DNS tạm thời mới này nhưng anh chàng đã cập nhật bản ghi trực tiếp không phải là bản thử nghiệm .

Đột nhiên, một máy chủ này (may mắn là một hộp mới nên một thông số hợp lý) phục vụ gần như mọi yêu cầu DNS cho gần 5 triệu người dùng - 400 triệu yêu cầu trong ngày đầu tiên! - may mắn thay, TTL chỉ sau 24 giờ nên giờ nó đã cạn kiệt.

1
Chopper3

Kích thước hoàn toàn khác nhau, nhưng đó vẫn là một tai nạn của quản trị viên hệ thống.

Xin lỗi: Bạn cần hiểu một số tiếng lóng tiếng Ý để có được điều này. Nó không thể được dịch. Bạn cần phải biết điều đó bằng trái tim

Tôi đã được yêu cầu sửa một cái gì đó trên máy chủ Solaris ở Napoli, Ý. Tôi cần mật khẩu gốc và lúc đó tôi không nói được nhiều tiếng Ý. Các anh chàng có vẻ miễn cưỡng nói cho tôi biết đó là gì. Cuối cùng, một trong số họ thì thầm:

sticazzi

Tôi nói: Aha, 'sticazzi'. Làm thế nào để bạn đánh vần nó ?, và đưa cho anh ấy một mảnh giấy + bút.

Một năm sau tôi gặp M.*o B.* một lần nữa (Xin chào! - nếu bạn đọc cái này). Lúc đó tiếng Ý của tôi tốt hơn nhiều. Tôi nói với anh ấy bây giờ tôi biết thêm một số tiếng Ý.

Đó là một tiếng cười khó khăn.

Đạo đức của câu chuyện: Nếu cần hỏi mật khẩu gốc bằng ngôn ngữ mà bạn không biết, một khi nó được trao cho bạn tốt hơn hãy cười, đỏ mặt và nhìn bị xúc phạm cùng một lúc.

1
fredarin

Vô tình mọi người đôi khi vô tình. Tôi đã cố gắng xóa một số tệp bổ sung trong thư mục nhà của tôi 2 ngày trước khi chuyển nhượng cấu trúc dữ liệu cuối cùng của tôi.

Về mặt chuyên môn, tôi đã có đủ khả năng để không gặp phải bất kỳ sự cố nào.

1
sclarson

Điều này đã không xảy ra với tôi, nhưng tôi đoán đó là một câu chuyện thực sự hay.

Những kẻ này đang làm việc với một trong những máy chủ toàn tháp Solaris cũ mà theo tôi biết, đang giữ cơ sở dữ liệu cho một số cơ sở dữ liệu của Informix mà công ty này có. Đây là một công ty tiện ích cơ bản để bạn có thể tưởng tượng có bao nhiêu dữ liệu.

Có một điểm mà một số cấu hình thông qua các máy chủ đã được sao chép trên một đĩa mềm và sau đó được truyền từ máy chủ này sang máy chủ khác. Sau khi làm việc với một máy chủ, họ sẽ đẩy đĩa mềm ra và chuyển sang đĩa tiếp theo.

Đi cùng với một người khác trong nhóm sysadmin, anh chàng này đang làm việc trên các cấu hình này khi họ nói về những thứ ngẫu nhiên. Anh ta đã hoàn thành bước của mình để anh ta nhấn nút để đẩy đĩa mềm ra.

- "CHỜ ĐỢI! Đừng nhả nút!"

Khi nhìn lại, anh ta đã nhấn nút thiết lập lại lỗi và không phải nút nhả. Tại thời điểm ông phát hành nút đó, toàn bộ hệ thống cơ sở dữ liệu cho công ty sẽ ngay lập tức tắt nguồn. (Tôi nghĩ các nút này là tức thời ... nhưng đây là cách câu chuyện diễn ra.)

Vì vậy, mỗi sysadmin dừng những gì anh ta đang làm để gọi cho các nhà quản lý bộ phận và "bảo mọi người đăng xuất khỏi hệ thống. Ngay bây giờ." trong khi anh chàng này nhìn mọi thứ xảy ra gắn liền với một máy chủ bằng ngón tay của mình.

1
Alpha

Trong khi thiết lập địa chỉ IP tĩnh trong /etc/network/interfaces trên hộp Debian, ai đó vô tình chuyển địa chỉ IP trên dòng địa chỉ IP và dòng cổng.

Đoán xem điều gì xảy ra khi bạn "đánh cắp" IP của công tắc lõi?

1
prestomation

Ồ, một ngày nọ tôi vô tình xóa cơ sở dữ liệu PostgreQuery và khôi phục nó từ các tệp nhật ký;)

0
maciek

Rất may, tôi đã có thể dễ dàng phục hồi từ những gì tôi sắp chia sẻ với bạn. Vì vậy, bạn đã nghe nói về sự khét tiếng

rm -rf /
đồng ý/y/s/b \

Vấn đề của tôi là tôi đã gõ cái này vào và biết nó sai, vì vậy tôi đã nhấn phím backspace, nhưng ngón tay mập mạp và thay vào đó là phím enter! Tôi chỉ mất 2 giây để nhận ra những gì tôi đã làm nên tôi bắt đầu nhấn ctrl-c liên tục để hủy bỏ hoạt động. Khi tôi dừng nó, một nửa hệ thống tập tin đã biến mất.

Sao lưu để giải cứu, các bạn của tôi! Khác với khởi động lại, không có thời gian khác. Theo một nghĩa nào đó, tôi đã thực sự may mắn ngày hôm đó vì tôi đã có những bản sao lưu tuyệt vời.

0
jftuga

Trong thời gian đầu quản trị hệ thống, tôi đã phát minh ra một số phương pháp mới để thực hiện quy trình kiểm kê (lấy hàng) cho các cửa hàng bán lẻ của chúng tôi. Tôi đã lấy rất nhiều máy tính xách tay và kết nối máy quét mã vạch với chúng và thực hiện quá trình nhanh hơn mười lần so với thông thường như khi chúng tôi làm điều đó bằng cách viết tất cả các bài viết bằng bút trên pappier. Tôi cũng đã mua một số thiết bị đầu cuối cầm tay Symbol PDT DOS. Để kéo dài tuổi thọ của pin cho thiết bị đầu cuối Biểu tượng, tôi đã tự tạo bộ pin và dây kết nối bằng tay. Tối hôm đó và sáng hôm sau tôi rất tự hào về bản thân mình và tôi tự hào khi một con công đi dạo quanh văn phòng nói rằng tôi thông minh như thế nào.

Cơn ác mộng bắt đầu khi tôi đang gửi dữ liệu lên máy chủ để tính toán và so sánh cổ phiếu và danh sách. Một trong những thiết bị Symbol có thêm bộ pin đã bị lóe lên vì một trong những dây bị mất và thiết bị không còn năng lượng trong một thời gian dài.

Bây giờ tất cả công việc của khoảng 100 chủ nhân rơi xuống nước. Mục đích của 13 hoặc 15 thiết bị và danh sách của chúng là gì nếu tôi không có tất cả chúng? Làm thế nào tôi có thể biết những gì hàng tồn kho bị thiếu.

Để mô tả kỹ hơn về thảm họa của tôi, chúng tôi chỉ có một vài ngày nghỉ trong năm. Đó là khi chúng tôi đóng cửa hàng của chúng tôi và thực hiện lấy cổ phiếu, và sự kiện đó khiến công ty chúng tôi tốn rất nhiều tiền và công sức.

May mắn cho tôi giám đốc và đầu bếp của chúng tôi về tái thẩm đó là hợp lý và chấp nhận danh sách hàng tồn kho như họ đã ở máy tính cho năm đó.

Sau đó, tôi luôn tạo hai bản sao dữ liệu trong khi công việc vẫn đang được tiến hành và ngay sau khi chúng tôi hoàn thành quy trình kiểm kê và tất nhiên tôi không khoe khoang nữa.

0
adopilot

Tôi là một chút của một người mới/người sysadmin chỉ với 30-40 trang được lưu trữ trên máy chủ của tôi nên điều này không quá tệ. Tôi đã xóa quyền thực thi trên tất cả các tệp trong thư mục/bin/xxx và tất cả đều bắt đầu bằng.

Vì vậy, hành động rõ ràng, tôi chạy

chmod -R a-x .*

Ồ Khi bạn xóa quyền thực thi trên thư mục bin của mình, việc dọn dẹp sẽ khá khó khăn. Các kỹ thuật viên của trung tâm dữ liệu đã phải khởi động vào một đĩa CD trực tiếp để sửa chữa. Phần tốt nhất là tôi phải hướng dẫn họ cách khắc phục. Điều tồi tệ nhất là họ vẫn biết đủ để cười tôi: P

0
Brandon Wamboldt

Trong những ngày đầu của Internet, tôi đã chạy mọi thứ trên các máy chủ của SGI Challenge S. Tại một thời điểm, không có kiến ​​thức của tôi, "bộ phận nghệ thuật" đã đặt hàng một máy chủ in thử bản demo từ IKON. Đi bộ vào một buổi sáng, Thử thách hành động hài hước, quản trị viên gọi vào phòng máy chủ, chúng tôi trải qua chẩn đoán thông thường, v.v ... cuối cùng tôi nói nó ĐÃ ĐƯỢC cung cấp năng lượng. Tất nhiên chúng tôi không có phụ tùng. Tôi quay trở lại văn phòng chính - nhìn thấy máy cho vay và nhận ra - đó cũng là một SGI - mở nó, tháo nguồn cung cấp, khởi động lại máy chủ - chơi lô tô! Chúng tôi đặt hàng qua đêm, đại diện xuất hiện vào sáng để hỏi xem chúng tôi thích bản demo như thế nào, chúng tôi phải hummada hummada trong 30 phút cho đến khi FedEx xuất hiện và chúng tôi trao đổi lại nguồn cung cấp năng lượng và đưa hộp demo ra khỏi cửa. Tất cả trong một ngày làm việc.

0
schemathings

Cách đây rất lâu, tôi đã quyết định thay đổi điểm gắn kết của phân vùng dữ liệu của mình. Vì vậy, tôi đã tạo một thư mục mới, thay đổi điểm gắn kết trong/etc/fstab và xóa thư mục mà nó đã được gắn vào trước đó.

Có một điều là tôi chỉ nhận ra rằng các phân vùng vẫn được gắn trên thư mục cũ khi nautilus chỉ cho tôi một thanh tiến trình (đối với những gì nên là xóa 4Kb). Rất may tôi đã có thể hủy nó trước khi một thiệt hại lớn được thực hiện, nhưng tôi đã mất một số tập tin.

0
Flávio Amieiro

Trong quá trình bảo trì tại một địa điểm, tôi đã kéo cáp nguồn DNS chính của chúng tôi. Tôi đã thay thế thứ cấp vào thời điểm đó và phải kéo cáp trước khi tôi đóng giá. Tất cả các trang web của chúng tôi bắt đầu giảm nhanh và tôi phải quay lại vị trí đồng để cắm thứ ngu ngốc đó lại.

0
Snipper

Trong nhiệm vụ cài đặt đầu tiên của tôi (nhiều năm trước, trong thời đại DOS), tôi đã vô tình xóa gần như tất cả các tệp hệ thống và một nửa tệp ứng dụng trên máy tính thuộc về giám đốc của tổ chức công cộng. Nhưng đó không phải là lỗi của tôi. Tôi cố gắng xóa các tệp không quan trọng trong thư mục C:/TEMP để giải phóng dung lượng. Xóa bắt đầu ... sau một vài phút, tôi thấy một số tên quen thuộc từ thư mục gốc và thư mục DOS cuộn lên trên màn hình ... Nhấn phím Ctrl + Break ... nhưng quá muộn ...

Đó là cách khó hơn để tìm hiểu vấn đề tệp liên kết chéo trên hệ thống tệp FAT là gì.

0
miHost

Chúng tôi có một cơ sở thử nghiệm lạnh cho các kỹ sư của chúng tôi ở phía bắc Minnesota. Khoảng 10 năm trước, chiếc T1 chúng tôi đã chết ở đó. Chúng tôi đã chuyển các máy chủ từ cơ sở đó đến trung tâm dữ liệu chính của chúng tôi vì chúng tôi đã cài đặt đường truyền nhanh hơn nên mọi thứ đều vô dụng ở đó. Hãy đến và phát hiện ra rằng một số nông dân ở trung tâm Minnesota đã chạy qua sợi với một số thiết bị nông nghiệp. Chúng tôi không quá vui khi sợi thậm chí có thể tiếp cận được với thiết bị đó và không bị chôn sâu hơn nhiều ...

0
squillman

Hình ảnh một tách cà phê. Đó là một cốc đầy, với đường. Hình ảnh nó bị đặt sai vị trí nghiêm trọng trên khay bàn phím có thể thu vào của giá đỡ. Một giá đầy máy chủ. Khay được đẩy bằng cách nào đó vào giá đỡ. Chiếc cốc đi vào giá đỡ và sau đó lật đổ.

Đó là lỗi của tôi và lúc đó tôi là một quản trị viên dày dạn, vì vậy tôi không có lời bào chữa nào. Có một phòng tắm gần đó và tôi đã có thể lau dọn hầu hết mớ hỗn độn bằng khăn giấy. May mắn là không có đủ cà phê vào máy chủ, vì vậy tôi tắt chúng và làm sạch chúng. Chỉ có 400 người dùng bị ảnh hưởng. Phù!

Sau đó, có một tai nạn khác, hãy gọi nó là như vậy, điều đó đã xảy ra với một người bạn của tôi. Ông đã dành 10 năm qua để xây dựng công ty của riêng mình. Anh ta có ~ 15 nhân viên và tất cả dữ liệu của công ty đều nằm trong một máy chủ này. Điều này bao gồm tất cả các dự án trong quá khứ và hiện tại, rất nhiều dữ liệu chi phí, thông tin anh đã được ký hợp đồng để giữ an toàn, tất cả thông tin liên lạc, v.v ... Tất cả được mã hóa độc đáo với LUKS. Tôi đã làm phiền anh ấy trong một thời gian dài để khiến anh ấy bắt đầu sao lưu, nhưng anh ấy không bao giờ làm thế. Quá bận rộn, thiếu tiền, bạn có được ý tưởng. Anh ấy tự tin RAID1 sẽ cứu anh ấy. Sao lưu cuối cùng của anh ấy được 8 tháng tuổi. Đó là thời gian hoạt động của máy chủ của anh ấy. Anh ta đã thay đổi mật khẩu LUKS ngay trước lần khởi động lại cuối cùng, 8 tháng trước đó. Bây giờ anh ta khởi động lại máy chủ của mình và sau đó nhận ra rằng anh ta đã không ghi lại mật khẩu mới và anh ta không nhớ nó. Tất cả những gì anh có thể nhớ là nó rất dài, và nó có một vài từ được sắp xếp theo một cách nào đó với một số chữ viết hoa và có thể là các biểu tượng được ném vào.

Bạn có thể tưởng tượng mức độ mất tinh thần giữa các nhân viên của anh ấy và cơn thịnh nộ của những người tiêu dùng phải gửi lại thông tin của họ để xử lý, do đó việc học dữ liệu của họ là "tạm thời" không có sẵn. Để làm cho một câu chuyện dài ngắn, tôi mất khoảng 40 giờ làm việc, 14 ngày thời gian chạy và một chương trình chuyên dụng để tạo và kiểm tra hơn một triệu mật khẩu để cuối cùng tìm thấy mật khẩu LUKS của mình.

0
joechip

Vài năm trước, quản trị viên iSeries của chúng tôi vào thời điểm đó đang thực hiện một số công việc dọn dẹp trong khu vực nơi các máy chủ IBM iSeries của chúng tôi ngồi trong phòng máy tính. Lúc này là khoảng 8:30 sáng. Ngay khi tôi bắt đầu bắt đầu với bất cứ điều gì tôi đang làm vào lúc đó. Màn hình trở nên trống rỗng vài giây sau khi các cuộc gọi điện thoại bắt đầu đến.

Đến để tìm hiểu, khi anh ta di chuyển một cái bàn, dây nguồn được quấn quanh chân vừa đủ để nó bật ra khi anh ta di chuyển cái bàn.

Khoảng hai giờ sau khi hệ thống tự phục hồi sau sự cố, mọi người đã có thể hoạt động trở lại.

0
Mike Wills

Chúng tôi đã có một chút lộn xộn một vài năm trước. Vào giữa buổi sáng, người dùng bắt đầu báo cáo vô số lỗi về việc khóa khi truy cập ứng dụng được lưu trữ trên SQL Server của chúng tôi. Ứng dụng hoàn toàn dừng lại - không ai có thể làm gì. Thay vì dành thời gian để tìm hiểu nguyên nhân gây ra nó, chúng tôi thực hiện khởi động lại khẩn cấp và mọi thứ bắt đầu hoạt động trở lại. Sau đó, tôi bắt đầu ghi lại thông qua các bản ghi khác nhau để xem những gì có thể đã kích hoạt nó, và ngay trước khi mọi thứ trở nên hoàn hảo, tôi tìm thấy một giao dịch có tên mở đối với bảng chính mà không có CAM KẾT tương ứng.

Hóa ra đồng nghiệp của tôi đã viết một số SQL trong Trình phân tích truy vấn để sửa một số dữ liệu sai trong bảng chính và anh ta đã đặt nó vào trong một giao dịch. Nhưng, thay vì chỉ nhấn F5 để chạy nó, anh ấy đã làm nổi bật toàn bộ và sau đó nhấn F5. Ngoại trừ anh ta đã không khá làm nổi bật tất cả mọi thứ ... anh ta đã bỏ lỡ kết thúc nơi thực sự CAM KẾT giao dịch ... khiến bảng bị khóa.

0
MartW