CÔNG TY CỔ PHẦN BLUESOFTS

Hướng dẫn hàm BS_WEBTAG lấy thông tin trên website-url theo tên Tag

 
Hàm BS_WEBTAG trong Add-in A-Tools cho phép lấy dữ liệu từ URL (trên website) lọc theo tên Tag. Bạn có thể khai báo XPath để hàm lấy dữ liệu theo đường dẫn.

Hàm trả về mảng các giá trị tìm được theo Tag. Giá trị là InnerText, bạn có thể khai báo tên loại thuộc tính muốn lấy trong tham số Option.

Cấu trúc

BS_WEBTAG(URL, TagName, [XPath], [Options])

Hàm chạy từ Add-in A-Tools 10.x
Các tham số trong [ ] có thể bỏ qua.

Các tham số

- URL: Là đường dẫn URL tới một website.

- TagName: Là Tag thuộc cấu trúc HTML. Nếu khai báo tên Tag, hàm sẽ lấy các thành phần của website có tên Tag khai báo. Ví dụ "div", "table".

- XPath: Kiểu chuỗi. Tham số này có thể bỏ qua. Nếu khai báo hàm sẽ tìm TagName thuộc XPath này.
 
- Options: Nếu bỏ qua, hàm sẽ lấy giá trị INNERTEXT của TagName. Bạn có thể khai báo các thông tin cần lấy "LISTCOLS=Name1, Name2,...,Namen;". Ví dụ "LISTCOLS=INDEX,ID;".

Làm thế nào để lấy XPath của nội dung trong HTML?

Trên trình duyệt Google Chrome, Microsoft Adge, nhấp chuột phải để hiển thị menu, chọn "Inspect".
Di chuyển chuột đến vùng data component trên trình duyệt, nhìn sang cửa sổ bên phải bạn sẽ thấy cấu trúc HTML. Trong cửa sổ bên phải có mã HTML, nhấp chuột phải vào một component, chọn Copy-> Copy XPath.

Ví dụ

Giả sử ô A1 chứa URL là:
https://bluesofts.net/Kien-thuc-Add-in-A-Tools/Ham-mang/Huong-dan-ham-BS_WEBTABLE---Lay-bang-du-lieu-trong-website-URL

Công thức lấy dữ liệu của các tag "div"

=BS_WEBTAG(A1, "div")

Kết quả là mảng dữ liệu là các giá trị hiển thị của thẻ "div".

Nếu bạn muốn lấy INDEX và ID của tag/thẻ TABLE công thức là:
=BS_WEBTAG(A1, "table", , "LISTCOLS=INDEX,ID;")

Nếu muốn đổ ra mảng với mọi phiên bản Excel thì dùng hàm BS_FILLARRAY bao ngoài cùng
=BS_FILLARRAY( BS_WEBTAG(A1, "table", , "LISTCOLS=INDEX,ID;") )

Kết quả là:
 
INDEX ID
1 data
2 data2

(*) Cách làm trên giúp bạn biết được các ID cũng như INDEX của Table để sử dụng trong hàm BS_WEBTABLE.

Ví dụ sử dụng XPath

Giả sử ô A1 chứa URL là:
https://bluesofts.net/Kien-thuc-Add-in-A-Tools/Ham-mang/Huong-dan-ham-BS_WEBTABLE---Lay-bang-du-lieu-trong-website-URL

Ô A2 chứa XPath là:
/html/body/form/div[4]/div/div[2]/h3

Công thức:
=BS_WEBTAG(A1, "div",  A2)


Tải Add-in A-Tools