Blog / Website

10 lỗi phổ biến nhất của Developer khi viết câu lệnh SQL

Dưới đây là những lỗi phổ biến thường gặp trong quá trình chúng ta viết câu lệnh SQL.

1. Không sử dụng PreparedStatements

Thực tế thì lỗi này vẫn còn xảy ra khá phổ biến trong các bài viết, trang diễn đàn chia sẻ sau nhiều năm xuất hiện của JDBC, ngay cả khi nó là 1 điều đơn giản để nhớ và hiểu. Có vẻ như 1 số nhà phát triển không sử dụng PreparedStatements vì 1 số lý do dưới đây:

          ·         Họ không hiểu về PreparedStatements

          ·         Họ nghĩ rằng sử dụng PreparedStatements  sẽ chậm hơn. 

          ·         Sử dụng PreparedStatements  sẽ tốn nhiều effort hơn. 

Đầu tiên, chúng ta cần phá bỏ những suy nghĩ trên. Bởi vì theo ước tính thì trên 96% các trường hợp, sử dụng PreparedStatements  tốt hơn static statement. Lý do là: 

         ·         Bạn có thể loại bỏ được lỗi cú pháp khi nối chuỗi ràng buộc các giá trị. 

         ·         Bạn có thể loại bỏ được các câu lệnh SQL injection từ việc nối chuối các ràng buộc giá trị. 

         ·         Bạn có thể tránh được các trường hợp thêm nhiều loại dữ liệu tinh vi như TIMESTAMP, dữ liệu nhi phân...

       ·         Bạn có thể tiếp tục mở PreparedStatements trong một khoảng thời gian, sử dụng chúng với các giá trị ràng buộc mới thay vì đóng chúng ngay lập tức (ví dụ như trong Postgres).

      ·         Bạn có thể sử dụng chia sẻ con trỏ thích ứng (Oracle-speak) trong các cơ sở dữ liệu phức tạp hơn. Điều này giúp ngăn chặn các câu lệnh SQL phân tích cú pháp cho mỗi tập hợp các giá trị ràng buộc mới.

Tuy nhiên trong 1 số trường hợp nhất định, bạn vẫn có thể sử dụng inline bind values (rằng buộc nội tuyến) khi viết các rằng buộc điều kiện cho câu lệnh SQL, với các trường giá trị được quy định là hàng số. Ví dụ:

        ·                ACTIVE = true

        ·                DELETED = 1

Vậy giải pháp đưa ra là: 

     ·             Mặc định, luôn luôn nghĩ đến việc sử dụng câu lệnh PreparedStatements  thay thế cho câu lệnh static statement. Và đặc biệt không sử dụng cộng chuỗi điều kiện các variable để tránh SQL injection.

 

2. Trả về quá nhiều cột

Lỗi này là khá thường xuyên và có thể dẫn đến giảm hiệu suất trong quá trình truy vấn cơ sở dữ liệu ứng dụng của bạn . Hãy nhìn vào 2 hiệu ứng làm giảm effect của ứng dụng khi select all quá nhiều cột. 

Tác động xấu đến ứng dụng xử lý phía backend

  • Khi bạn SELECT * với bảng 50 coloumns, thì bạn sẽ sử dụng lại giữa các DAOs, bạn cần transfer nhiều dữ liệu từ database đến JDBC ResultSet. Ngay cả khi bạn không đọc dữ liệu từ ResultSet, nó đã được truyền qua đường dây và được nạp vào bộ nhớ của bạn bằng trình điều khiển JDBC. Đó là một sự lãng phí IO và bộ nhớ nếu bạn chỉ cần 2-3 trong số những cột đó.

Tác động xấu đến thực thi câu lệnh trong database

  • Khi thao tác truy vấn xảy ra với 1 lượng lớn dữ liệu, cùng với các câu lệnh JOIN , điều kiện rất phức tạp, thì việc lấy về nhiều dữ liệu cột không dùng đến thì việc thực thi câu lệnh sẽ tốn nhiều effort hơn.

Vậy giải pháp đưa ra là: 

  • Chỉ sử dụng SELECT * khi cần thiết.
  • Tuy nhiên điều này thực sự là khá khó để đạt được khi sử dụng ORMs

3. Nghĩ rằng JOIN là 1 mệnh lệnh đề SELECT

  • Đây không phải là sai lầm với rất nhiều ảnh hưởng đến hiệu suất hoặc tính chính xác của SQL. Tuy nhiên, các nhà phát triển SQL cần phải nhận thức được rằng mệnh đề JOIN không phải là một phần của câu lệnh SELECT
  • Tiêu chuẩn SQL 1992 xác định tham chiếu bảng như sau:

 

  • Mệnh đề FROM và bảng join cũng có thể sử dụng các tham chiếu bảng như sau:

 

 

Vậy giải pháp đưa ra là:

  • Nếu bạn viết một mệnh đề JOIN, hãy nghĩ đến mệnh đề JOIN này là một phần của một tham chiếu bảng theo syntax chuẩn:

 

4. Đặt mệnh đề JOIN vào thành phần điều kiện (where clause)

  • Việc này làm giảm hiệu suất, làm cho câu lệnh JOIN không tường minh.
  • Không nên sử dụng:

 Mà hãy sử dụng chuẩn syntax Join:

 

5. Quên không escapse dữ liệu input khi sử dụng câu lệnh LIKE

  • Theo Tiêu chuẩn SQL năm 1992 xác định câu lệnh LIKE như sau:

 

  • Từ khóa ESCAPE nên được sử dụng luôn luôn khi cho phép người dùng nhập vào được sử dụng trong các truy vấn SQL của bạn:

 

6. Nghĩa rằng NOT (A IN (X,Y)) là đảo ngược của A IN (X,Y)

  • Điều này là tinh tế nhưng rất quan trọng đối với NULLs! Hãy xem xét A IN (X, Y) thực sự có ý nghĩa gì:

 

  • Điều đó trông giống như sự đảo ngược của các vị từ trước, nhưng nó thực sự không phải. Nếu bất kỳ của X hoặc Y là NULL, thì NOT IN sẽ cho kết quả UNKNOWN trong khi vị từ IN vẫn có thể trả về một giá trị boolean.

 

7. Sử dụng lọc dữ liệu cần thiết bên ngoài truy vấn dữ liệu

  • Bạn có thể optimize tốc độ của chương trình hơn bằng cách kết hợp các điều kiện lọc từ khi truy vấn dữ liệu. Thay vì việc sử dụng vòng lặp để lọc dữ liệu sau khi dữ liệu đã được lấy ra từ database.

8. Không sử dụng biểu thức chính quy (row value expressions)

  • Biểu thức giá trị hàng là một tính năng SQL tuyệt vời. Vì vậy sử dụng biểu thức giá trị hàng bất cứ khi nào bạn có thể. Nó sẽ làm cho SQL của bạn súc tích hơn và thậm chí nhanh hơn.

9. Không định nghĩ đủ ràng buộc (constraints)

  • Một vài developers nghĩ là các rằng buộc khiến cho việc truy vấn và cập nhật dữ liệu của chúng ta chậm hơn. Nhưng nó đảm bảo cho dữ liệu đồng nhất và không bị mất dữ liệu. Trong trường hợp bạn phải thao tác với nhiều records dữ liệu cùng lúc, bạn có thể nghĩ đến việc sử dụng các bảng tạm để chuyển tiếp các dữ liệu cần thiết.

10. Hãy nghĩ về NoSQL

  • Một số tập đoàn lớn (như: Twitter or Facebook) thay vì sử dụng SQL truyền thống mà chuyển sang sử dụng NoSQL để thao tác với 1 lượng dữ liệu khồng lồ.

Nguồn: Laptrinh X


Chủ đề liên quan

Đăng ký nhận KHUYẾN MÃI mới nhất