Thao Tác Với Chuỗi Trong Python
Có thể bạn quan tâm

Khi xử lý văn bản, thường phải thao tác với chuỗi như là nối chuỗi, chia chuỗi thành các thành phần thông thường hoặc đổi thành chữ hoa hoặc chữ thường. Chúng ta sẽ thảo luận về các phương pháp nâng cao hơn để phân tích cú pháp và tách văn bản sau. Tuy nhiên, trong nhiều trường hợp, việc chia đoạn văn thành các dòng, các câu hoặc thậm chí các từ sẽ rất hữu ích. Cũng có trường hợp, ta cần loại bỏ một số ký tự trong các từ hoặc một từ sẽ cần được thay thế bằng một cách nào đó để có thể so sánh nó với một giá trị được xác định trước.
Bắt đầu
Chúng ta sử dụng một đoạn văn bản cơ bản và biến nó thành các thành phần chính; sau đó, chúng ta sẽ xây dựng lại nó. Ví dụ: một báo cáo cần được chuyển đổi sang một định dạng mới để được gửi qua email.
Dữ liệu input sử dụng trong ví dụ này là:
AFTER THE CLOSE OF THE SECOND QUARTER, OUR COMPANY, CASTAÑACORP
HAS ACHIEVED A GROWTH IN THE REVENUE OF 7.47%. THIS IS IN LINE
WITH THE OBJECTIVES FOR THE YEAR. THE MAIN DRIVER OF THE SALES HAS BEEN
THE NEW PACKAGE DESIGNED UNDER THE SUPERVISION OF OUR MARKETING DEPARTMENT.
OUR EXPENSES HAS BEEN CONTAINED, INCREASING ONLY BY 0.7%, THOUGH THE BOARD
CONSIDERS IT NEEDS TO BE FURTHER REDUCED. THE EVALUATION IS SATISFACTORY
AND THE FORECAST FOR THE NEXT QUARTER IS OPTIMISTIC. THE BOARD EXPECTS
AN INCREASE IN PROFIT OF AT LEAST 2 MILLION DOLLARS.
Chúng ta cần biên tập lại văn bản để loại bỏ bất kỳ tham chiếu nào đến các con số. Văn bản cũng cần phải được định dạng đúng bằng cách thêm một dòng mới sau mỗi dấu chấm, và điều chỉnh với 80 ký tự một dòng. Cuối cùng, văn bản nên được chuyển đổi thành mã ASCII vì lý do tương thích.
Văn bản sẽ được lưu trữ trong biến INPUT_TEXT
>>> INPUT_TEXT = ''' ... AFTER THE CLOSE OF THE SECOND QUARTER, OUR COMPANY, CASTAÑACORP ... HAS ACHIEVED A GROWTH IN THE REVENUE OF 7.47%. THIS IS IN LINE ... '''Thực hiện như thế nào ?
1. Sau khi nhập văn bản, hãy chia nó thành các từ riêng lẻ
>>> words = INPUT_TEXT.split()2. Thay thế bất kỳ chữ số nào bằng ký tự ‘X’
>>> redacted = [''.join('X' if w.isdigit() else w for w in word) for word in words]3. Chuyển văn bản thành ASCII thuần túy (lưu ý rằng tên của công ty có chứa ký tự ñ, không phải là ASCII)
>>> ascii_text = [word.encode('ascii', errors='replace').decode('ascii') ... for word in redacted]4. Nhóm các từ thành các dòng 80 ký tự
>>> newlines = [word + '\n' if word.endswith('.') else word for word in ascii_text] >>> LINE_SIZE = 80 >>> lines = [] >>> line = '' >>> for word in newlines: ... if line.endswith('\n') or len(line) + len(word) + 1 > LINE_SIZE: ... lines.append(line) ... line = '' ... line = line + ' ' + word ...5. Định dạng tất cả các dòng thành kiểu title và nối chúng thành một đoạn văn bản duy nhất
>>> lines = [line.title() for line in lines] >>> result = '\n'.join(lines)6. In kết quả
>>> print(result) After The Close Of The Second Quarter, Our Company, Casta?Acorp Has Achieved A Growth In The Revenue Of X.Xx%. This Is In Line With The Objectives For The Year. The Main Driver Of The Sales Has Been The New Package Designed Under The Supervision Of Our Marketing Department. Our Expenses Has Been Contained, Increasing Only By X.X%, Though The Board Considers It Needs To Be Further Reduced. The Evaluation Is Satisfactory And The Forecast For The Next Quarter Is Optimistic. The Board Expects An Increase In Profit Of At Least X Million Tags: python, thao tác chuỗiShare this content
- Opens in a new window
- Opens in a new window
- Opens in a new window
Read more articles
Previous PostTạo chuỗi với các giá trị được định dạng trong python Next PostTrích xuất dữ liệu từ các chuỗi có cấu trúc trong pythonYou Might Also Like
Cách thực hiện phân tích dữ liệu khám phá
22/02/2024
Trích xuất dữ liệu từ các chuỗi có cấu trúc trong python
09/11/2023
Python Tuple
09/12/2023Leave a Reply Cancel reply
CommentEnter your name or username to comment Enter your email address to comment Enter your website URL (optional)Save my name, email, and website in this browser for the next time I comment.
Tìm kiếmGOVề tôi
Trong Nghia
Tôi là Trọng Nghĩa, giảng viên ngành Trí tuệ nhân tạo và Khoa học dữ liệu với hơn 10 năm kinh nghiệm. Sứ mệnh của tôi là chia sẻ kiến thức và kinh nghiệm để giúp mọi người hiểu và áp dụng công nghệ một cách thông thái và hiệu quả.- Opens in a new tab
- Opens in a new tab
- Opens in a new tab
Bài viết mới
- 5 Thư Viện Python Mạnh Nhất Cho Phân Tích Dữ Liệu Thời Gian
- Pixi – Cách Quản Lý Môi Trường Python Thông Minh và Hiện Đại
- Dự báo chuỗi thời gian với mô hình cây quyết định
- AI và Machine Learning ngoài Python: Java, Rust, Go và C#/.NET đang đứng ở đâu?
- Cập nhật thông tin lớp 25170103 – Phân tích dữ liệu
Bình luận mới
Bài viết hữu ích
-
Hướng dẫn xây dựng ứng dụng Blockchain an toàn bằng Python 20/01/2025/ 0 Comments -
Đảo ngược chuỗi trong python 24/02/2024/ 0 Comments -
Xác định sự giống nhau của hình ảnh bằng Python 24/02/2024/ 0 Comments -
Python Tuple 09/12/2023/ 0 Comments -
Cơ bản python 3 09/11/2023/ 0 Comments
| M | T | W | T | F | S | S |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 | 31 |
Từ khóa » Thao Tác Với Chuỗi Trong Python
-
Các Hàm Xử Lý Chuỗi Trong Python
-
Hướng Dẫn Thao Tác Với String Trong Python - NIIT - ICT Hà Nội
-
Chuỗi (String) Trong Python - Học Lập Trình Python - Viettuts
-
Python: Hàm Xử Lý Chuỗi | V1Study
-
Một Số Thao Tác Với Chuỗi Ký Tự Trên Python - TEK4
-
09. Chuỗi Trong Python
-
Chuỗi (String) Trong Python
-
Kiểu Dữ Liệu Chuỗi Và định Dạng Chuỗi Trong Python | TopDev
-
Hướng Dẫn Và Ví Dụ String Trong Python - Openplanning
-
Một Số Hàm Xử Lý Chuỗi Trong Python - Lập Trình Từ Đầu
-
Kiểu Chuỗi Ký Tự Trong Python | Lập Trình Từ Đầu
-
Tất Cả Những Gì Bạn Cần Biết Về Chuỗi Trong Python
-
Giới Thiệu Về Các Hàm Chuỗi Trong Python 3
-
Tìm Hiểu Về String Trong Python Từ A-Z - T3H