it-swarm-vi.tech

Trình chỉnh sửa văn bản để mở các tệp văn bản lớn (khổng lồ, khổng lồ, lớn)

Ý tôi là lớn hơn 100 MB; tập tin văn bản như vậy có thể đẩy phong bì của các biên tập viên.

Tôi cần xem qua một tệp XML lớn, nhưng không thể nếu trình soạn thảo bị lỗi.

Bất kỳ đề xuất?

1023
Yuvi

Mã VS(Windows, macOS, Linux) - Nguồn mở và miễn phí với GUI đẹp. Đã chỉnh sửa tệp JSON 3,6 GB, được tải trong một phút. Bạn phải có đủ RAM để tải các tệp.

Người xem chỉ đọc miễn phí:

  • glogg (Windows, macOS, Linux) - Được xác nhận để xử lý các tệp nhiều GB. Tính năng chính của nó là tìm kiếm biểu thức thông thường. Có các tab, đọc tệp trực tiếp từ đĩa, có thể xem/theo dõi tệp và cho phép người dùng đánh dấu các dòng.
  • LogExpert (Windows) - "Thay thế GUI cho tail." Hỗ trợ theo dõi tập tin, tìm kiếm, lọc, tô sáng cấu hình, plugin và các công cụ bên ngoài.
  • Trình xem tệp văn bản lớn (Windows) - Tối giản và có kích thước thực thi rất nhỏ. Hỗ trợ chế độ xem tách, tùy chỉnh chủ đề văn bản, tìm kiếm regex và tệp sau.
  • Lister (Windows) - Thậm chí nhỏ hơn và tối giản hơn. Đó là một thực thi, chỉ có 500 KB, nhưng nó vẫn hỗ trợ tìm kiếm (với biểu thức chính quy), in, chế độ soạn thảo hex và cài đặt.

Biên tập viên miễn phí:

  • Vim Emacs (Windows, macOS, Linux) - Trình chỉnh sửa Unix cổ điển. Đường cong học tập ổn định, nhưng hiệu quả tàn bạo. Họ có các cài đặt có thể được điều chỉnh để làm cho chúng nhanh hơn nữa.
  • Trình chỉnh sửa tệp lớn (Windows) - Mở và chỉnh sửa các tệp TB +, hỗ trợ Unicode, sử dụng ít bộ nhớ, có các tính năng dành riêng cho XML và bao gồm chế độ nhị phân.
  • HxD (Windows) - Trình chỉnh sửa hex, không phải trình soạn thảo văn bản; nhưng nó nhanh và hữu ích.
  • GigaEdit (Windows) - Hỗ trợ tìm kiếm, thống kê ký tự và tùy chỉnh phông chữ. Nhưng đó là lỗi - với các tệp lớn, nó chỉ cho phép ghi đè các ký tự, không chèn chúng; nó không tôn trọng LF với tư cách là một đầu cuối dòng, chỉ CRLF; và nó chậm.

Các chương trình dựng sẵn (không cần cài đặt):

  • less (macOS, Linux) - Công cụ máy nhắn tin dòng lệnh Unix truyền thống. Cho phép bạn xem các tập tin văn bản thực tế ở bất kỳ kích thước. Có thể được cài đặt trên Windows, quá.
  • Notepad (Windows) - Decent với các tệp lớn, đặc biệt là tắt Word quấn.
  • MORE (Windows) - Điều này đề cập đến Windows MORE, không phải là Unix more. Một chương trình điều khiển cho phép bạn xem một tập tin, một màn hình tại một thời điểm.

Người xem web:

  • htmlpen.com - Có thể mở và tô sáng các tệp TB +. Cho phép chỉnh sửa, ngoại trừ các tệp rất lớn. Hỗ trợ tìm kiếm, biểu thức chính quy và xuất.
  • readfileonline.com - Một trình xem tệp lớn HTML5 khác. Hỗ trợ tìm kiếm.

Biên tập viên trả phí:

  • 010 Editor (Windows, macOS, Linux) - Mở các tệp khổng lồ (tối đa 50 GB).
  • SlickEdit (Windows, macOS, Linux) - Mở các tệp lớn.
  • UltraEdit (Windows, macOS, Linux) - Mở các tệp lớn hơn 6 GB, nhưng phải thay đổi cấu hình để thực tế: Menu »Nâng cao» Cấu hình »Xử lý tệp» Tệp tạm thời »Mở tệp không có tệp tạm thời ...
  • EmEditor (Windows) - Xử lý các tệp văn bản rất lớn độc đáo (chính thức lên tới 248 GB, nhưng tối đa 900 GB theo một báo cáo).

Và cuối cùng, bạn đã thử mở tệp lớn bằng trình chỉnh sửa thông thường của mình chưa? Một số trình soạn thảo thực sự có thể xử lý các tệp lớn hợp lý. Cụ thể, Notepad ++ (Windows) và Sublime Text (Windows, macOS, Linux) hỗ trợ các tệp trong phạm vi 2 GB.

1256
Nick Ryberg

Các mẹo và thủ thuật

ít hơn

Tại sao bạn sử dụng biên tập viên để chỉ nhìn tại một tệp (lớn)?

Trong * nix hoặc Cygwin , chỉ cần sử dụng ít hơn . (Có một câu nói nổi tiếng - "ít hơn là nhiều hơn, nhiều hơn hoặc ít hơn" - bởi vì "ít hơn" đã thay thế lệnh Unix trước đó "nhiều hơn", với việc bổ sung mà bạn có thể cuộn lại.) Tìm kiếm và điều hướng theo ít hơn rất giống với Vim, nhưng không có tệp hoán đổi và ít RAM được sử dụng.

Có một cổng Win32 là GNU ít hơn. Xem phần "ít" của câu trả lời ở trên.

Perl

Perl phù hợp với các tập lệnh nhanh và toán tử .. (phạm vi lật) của nó tạo ra một cơ chế lựa chọn Nice để hạn chế lỗi mà bạn phải lội qua.

Ví dụ:

$ Perl -n -e 'print if ( 1000000 .. 2000000)' humongo.txt | less

Điều này sẽ trích xuất mọi thứ từ dòng 1 triệu đến dòng 2 triệu và cho phép bạn sàng lọc đầu ra theo cách thủ công.

Một vi dụ khac:

$ Perl -n -e 'print if ( /regex one/ .. /regex two/)' humongo.txt | less

Điều này bắt đầu in khi "biểu thức chính quy một" tìm thấy một cái gì đó và dừng lại khi "biểu thức chính hai" tìm thấy phần cuối của một khối thú vị. Nó có thể tìm thấy nhiều khối. Chọn lọc đầu ra ...

logparser

Đây là một công cụ hữu ích khác mà bạn có thể sử dụng. Để trích dẫn bài viết Wikipedia :

logparser là một tiện ích dòng lệnh linh hoạt ban đầu được viết bởi Gabriele Giuseppini, một nhân viên của Microsoft, để tự động hóa các kiểm tra cho việc ghi nhật ký IIS. Nó được thiết kế để sử dụng với hệ điều hành Windows và được bao gồm trong IIS 6.0 Bộ công cụ tài nguyên. Hành vi mặc định của logparser hoạt động giống như một "đường ống xử lý dữ liệu", bằng cách lấy một biểu thức SQL trên dòng lệnh và xuất ra các dòng chứa khớp cho biểu thức SQL.

Microsoft mô tả Logparser là một công cụ mạnh mẽ, linh hoạt, cung cấp quyền truy cập truy vấn chung vào dữ liệu dựa trên văn bản như tệp nhật ký, tệp XML và tệp CSV, cũng như các nguồn dữ liệu chính trên hệ điều hành Windows như Nhật ký sự kiện, Sổ đăng ký, hệ thống tập tin và Active Directory. Các kết quả của truy vấn đầu vào có thể được định dạng tùy chỉnh trong đầu ra dựa trên văn bản hoặc chúng có thể được duy trì cho các mục tiêu đặc biệt hơn như SQL, SYSLOG hoặc biểu đồ.

Ví dụ sử dụng:

C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line > 1000 and line < 2000"
C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line like '%pattern%'"

Tính tương đối của kích thước

100 MB không quá lớn. 3 GB đang trở nên lớn. Tôi đã từng làm việc tại một cơ sở in & thư đã tạo ra khoảng 2% thư hạng nhất của Hoa Kỳ. Một trong những hệ thống mà tôi là người dẫn đầu về công nghệ chiếm khoảng 15 +% số thư. Chúng tôi đã có một số tệp lớn để gỡ lỗi ở đây và ở đó.

Và hơn thế nữa...

Hãy thêm nhiều công cụ và thông tin ở đây. Câu trả lời này là wiki cộng đồng vì một lý do! Tất cả chúng ta cần tư vấn thêm về việc xử lý một lượng lớn dữ liệu ...

178
Roboprog