Tải bản đầy đủ

Nâng cao hiệu quả marketing online của thammyvienphuxuan vn thông qua công cụ SEO

LỜI CẢM ƠN
Trong quá trình thực hiện đề tài Khóa luận tốt nghiệp "Nâng cao hiệu quả
Marketing online của thammyvienphuxuan.vn thông qua công cụ SEO" em đã
nhận được sự giúp đỡ rất nhiều từ gia đình, thầy cô, Công ty TNHH Truyền thông
và Công nghệ Big Digital Agency và các bạn cùng khóa.
Em xin bày tỏ lòng biểt ơn sâu sắc đển Thạc sĩ Trần Thu Phương và Thạc sĩ
Đỗ Văn Đại đã tận tình quan tâm, hướng dẫn, chỉ bảo trong quá trình thực hiện
Khóa luận để em có thể hoàn thành tốt khóa luận này.
Em xin chân thàn cảm ơn quý Thầy cô trong Khoa Hệ thống thông tin kinh tế
đã tận tình giảng dạy, trang bị cho em những kiển thức quý báu trong những năm
học vừa qua.
Em xin cảm ơn tới toàn thể Công ty TNHH Truyền thông và Công nghệ Big
Digital Agency đã tạo điều kiện thuận lợi, giúp em học hỏi và làm việc tại công ty
trong thời gian thực tập.
Mặc dù cố gắng hoàn thành khóa luận trong phạm vi và khả năng cho phép,
bài khóa luận của em chắc chắn sẽ không tránh khỏi những thiểu sót. Em rất mong
nhận được sự thông cảm góp ý và tận tình chỉ bảo của quý Thầy cô và các bạn để
khóa luận tốt nghiệp của em được hoàn thiện hơn.
Em xin chân thành cảm ơn !
Thái nguyên, Ngày


tháng

Sinh viên thực hiện.

năm 2016


LỜI CAM ĐOAN
Em xin cam đoan toàn bộ nội dung trong khóa luận này là do em nghiên
cứu các tài liệu, khảo sát tại công ty từ đó viết cơ sở lý thuyết liên quan đến việc
thực hiện khóa luận tốt nghiệp “Nâng cao hiệu quả marketing online
của thammyvienphuxuan.vn thông qua công cụ SEO ( Search Engine
Optimization)” và ứng dụng thực tế vào SEO website thammyvienphuxuan.vn.
Khóa luận tốt nghiệp không sao chép từ bất kỳ một chương trình hay một sản
phẩm nào khác.
Người cam đoan


MỤC LỤC
LỜI CẢM ƠN ...........................................................................................................
LỜI CAM ĐOAN......................................................................................................
MỤC LỤC ................................................................................................................
DANH MỤC HÌNH ..................................................................................................
BẢNG CÁC TỪ VIẾT TẮT .....................................................................................
LỜI NÓI ĐẦU ........................................................................................................1
Chương 1. CƠ SỞ LÍ THUYẾT VỀ MARKETING ONLINE THÔNG QUA
CÔNG CỤ SEO ( SEARCH ENGINE OPTIMIZATION )......................................2
1.1. MỘT SỐ ĐỊNH NGHĨA, KHÁI NIỆM CƠ BẢN ........................................2
1.1.1. Marketing là gì ? ..................................................................................2
1.1.2. Marketing điện tử là gì ? ......................................................................2
1.1.3. Công cụ SEO .......................................................................................2
1.1.4. Quảng bá website .................................................................................2
1.2. CƠ SỞ LÝ THUYẾT VỀ MARKETING ONLINE THÔNG QUA CÔNG
CỤ SEO..............................................................................................................3
1.2.1. Tổng quan về Marketing online............................................................3
1.2.2. Tổng quan bộ máy tìm kiếm.................................................................6
1.2.3. Cấu tạo chung các bộ máy tìm kiếm .....................................................9
1.2.4. Hệ thống Rank ...................................................................................16
1.2.5. Các thuật toán của Google..................................................................19
1.2.6. Tìm hiểu về SEO................................................................................21

Chương 2. TRIỂN KHAI, THỬ NGHIỆM MỘT SỐ GIẢI PHÁP NÂNG CAO
THỨ HẠNG TÌM KIẾM TRONG WEBSITE THAMMYVIENPHUXUAN.VN .34
2.1. Giới thiệu chung về Công ty TNHH Truyền thông và Công nghệ Big
Digital Agency .................................................................................................34
2.2. Giới thiệu về Thẩm mỹ viện Phú Xuân ......................................................34
2.3 . Nghiên cứu, phân tích, chọn bộ từ khóa (keyword) ...................................36
2.3.1. Nghiên cứu từ khóa ............................................................................36


2.3.2. Sử dụng các công cụ nghiên cứu từ khóa............................................36
2.4. Phân tích đối thủ ........................................................................................39
2.5. OnPage SEO ..............................................................................................39
2.5.1. Tiêu đề chính xác và duy nhất ............................................................40
2.5.2. Tối ưu từ khóa và cấu trúc URL .........................................................41
2.5.3. Sử dụng thẻ Header Tag (các thẻ h1 – h6, thẻ bôi đậm, in nghiêng) ..43
2.5.4. Thẻ Image Alt ...................................................................................43
2.5.5. Thẻ Meta Description.........................................................................45
2.5.6. Liên kết nội bộ ...................................................................................45
2.5.7. Giúp người dùng dễ dàng chia sẻ bài viết và tương tác .......................47
2.5.8. Cung cấp nội dung và dịch vụ chất lượng...........................................47
2.6. Offpage SEO..............................................................................................49
2.6.1 Tìm các blog liên quan để comment. ...................................................50
2.6.2.Tìm các forum liên quan để post bài....................................................52
2.6.3. Lập fanpage, post bài lên facebook.....................................................52
2.6.4. Xây dựng link bằng Guest Post .........................................................54
2.6.5. Tạo file PDF có chứa nội dung bài viết, upload và trỏ về ...................55
2.6.6. Xây dựng link từ blog riêng, xây dựng theo link Pyramid..................55
Chương 3. KẾT QUẢ ĐẠT ĐƯỢC VÀ PHƯƠNG PHÁP GIỮ TOP 10 KHI SEO
THÀNH CÔNG.....................................................................................................56
3.1. Kết quả một số từ khóa và lượng truy cập website sau khi thực hiện SEO..56
3.1.1. Kết quả một số từ khóa sau khi thực hiện SEO...................................56
3.1.2. Thống kê lượng truy cập của Website ................................................61
3.2. Kết quả Marketing Online của thammyvienphuxuan.vn sau khi thực hiện
SEO..................................................................................................................61
3.3. Phương pháp giữ top 10 khi SEO thành công.............................................62
KẾT LUẬN...........................................................................................................64
TÀI LIỆU THAM KHẢO .....................................................................................65


DANH MỤC HÌNH
Hình 1.1: Tổng quan cách thức làm việc của bộ máy tìm kiếm ................................7
Hình 1.2: Biểu đồ thị phần search engine từ tháng 4 - 2013 .....................................8
Hình 1.3: Cấu tạo Search Engine .............................................................................9
Hình 1.4: Mô hình xử lý tổng quát hệ thống lập chỉ mục .......................................12
Hình 1.5: Hệ thống tự động đoán hành vi tìm kiếm ...............................................15
Hình 1.6: Minh họa về chỉ số Reach của Alexa......................................................18
Hình 1.7: Alexa Rank ............................................................................................18
Hình 1.8 Lập chỉ mục và hiển thị kết quả...............................................................19
Hình 1.9: Thẻ tiêu đề trang web.............................................................................25
Hình 1.10: Thẻ mô tả trang web ............................................................................25
Hình 1.11: URL chứa từ khóa của trang web .........................................................26
Hình 1.12. Xây dựng Link theo mô hình kim tự tháp............................................29
Hình 1.13. Xây dựng link theo mô hình Link Wheel.............................................30
Hình 2.1 : Giao diện chính của website..................................................................35
Hình 2.2 : Ví dụ minh họa khung tìm kiếm của Google .........................................37
Hình 2.3: Ví dụ minh họa về Công cụ đánh giá từ khóa ( Keyword Tool – Google
Adwords)...............................................................................................................37
Hình 2.4: Tiêu đề của trang xuất hiện vị trí trên cùng của trình duyệt ....................40
Hình 2.5: Truy vấn Google ....................................................................................41
Hình 2.6: Chèn từ khóa “ nâng mũi s-line” vào tiêu đề bài viết và URL ...............42
Hình 2.7: Phân tán từ khóa “ xóa xăm” trong bài viết và thẻ tiêu đề ......................42
Hình 2.8: Phân tán từ khóa “ tắm trắng Thụy Sỹ” trong bài viết và thẻ tiêu đề Error!
Bookmark not defined.
Hình 2.9: Đặt tiêu đề bài viết trong thẻ H1 và có chưa từ khóa ..............................43
Hình 2.10: Đặt từ khóa trong thẻ ALT ..................................................................44
Hình 2.11: Liên kết nội bộ các bài viết với nhau....................................................46
Hình 2.12 : Thống kê bài viết mới nhất và xem nhiều nhất ....................................48
Hình 2.13: Viết bài và comment trên nền blogspot ................................................50


Hình 2.14: Viết bài và comment trên nền wordpres ...............................................51
Hình 2.15 : Viết bài và comment trên forum.........................................................52
Hình 2.16: Lượng tương tác mỗi bài post facebook ...............................................53
Hình 3.1: Website nằm top 1 Google với từ khóa “Phú Xuân” ..............................56
Hình 3.2: Website nằm top 1 Google với từ khóa “Tẩy lông chân bằng kem đánh
răng” .....................................................................................................................57
Hình 3.3: Website nằm top 5 Google với từ khóa “Thẩm mỹ viện công nghệ cao” 58
Hình 3.4 : Kết quả một số từ khóa SEO trên Google..............................................60


BẢNG CÁC TỪ VIẾT TẮT
STT Từ viết tắt

Từ gốc

Diễn giải
Tối ưu hóa công cụ tìm kiếm bằng
những thủ thuật không đáng tin cậy

1

Black Hat
SEO

Black Hat Search
Engine Optimization

2

CSDL

Cơ sở dữ liệu

3

PR

Page Rank

Hệ thống xếp hạng

4

SE

Search Engine

Công cụ tìm kiếm

5

SEO

Search Engine
Optimization

Tối ưu hóa công cụ tìm kiếm.

6

Upload

Upload

7

URL

Uniform Resource
Locator

8

Web

Website

9

White Hat
SEO

White Hat Search
Engine Optimization

Tải lên
Tham chiếu tới tài nguyên trên Internet
Trang web
Tối ưu hóa công cụ tìm kiếm bằng
những thủ thuật tin cậy


LỜI NÓI ĐẦU
Ngày nay, cùng với sự phát triển của nhiều công nghệ tiên tiến, hiện đại nhằm
phục vụ nhu cầu sống và làm việc của con người trong đó có công nghệ thông tin với
tốc độ phát triển nhanh đến chóng mặt. Đặc biệt là trong việc kinh doanh, chính mảng
thông tin sẽ tạo ra nhiều lợi nhuận nhất cho các doanh nghiệp, vì nó cung cấp một
cổng vào ngay lập tức cho khách hàng hay cho các đối tác tiềm năng. Và website của
doanh nghiệp không chỉ đơn giản là giới thiệu về doanh nghiệp mà còn cung cấp một
lượng thông tin thích đáng cho người truy cập về sản phẩm và giá cả.
Nhờ ineternet, các hoạt động thương mại được thực hiện nhanh hơn, hiệu
quả hơn, giúp tiết kiệm chi phí và mở rộng không gian kinh doanh.Vấn đề đặt ra là
"Làm sao đưa website của bạn đến với nhiều khách hàng hay các đối tác tiềm năng
nhất có thể?". Theo thống kê có đến 80% số người tìm đến website lần đầu tiên qua
Search Engine như Google hay Yahoo. Tối ưu hóa SEO (viết tắt của Search Engine
Optimization), là cách tối ưu hóa kết quả tìm kiếm. Kết quả của việc thực hiện SEO
là giúp website của bạn tăng thứ hạng lên cao nhất trong các trang kết quả tìm kiếm
của các bộ máy tìm kiếm chính như Google,Yahoo, Bing,... Rõ ràng khi website của
bạn đứng trong top đầu của kết quả tìm kiếm, người dùng sẽ truy cập website của
bạn nhiều hơn.
Nhận thức được tầm quan trọng của việc tối ưu hóa kết quả tìm kiếm ( SEO), em
đã chọn khóa luận với nội dung “Nâng cao hiệu quả marketing online
của thammyvienphuxuan.vn thông qua công cụ SEO ( Search Engine Optimization)”.
Mục tiêu nghiên cứu
 Hệ thống hóa cơ sở lý luận về Marketing Online thông qua công cụ SEO :
- Nắm được cơ sở lý thuyết chung về quảng cáo trực tuyến và các vấn đề
trong quáng bá website.
- Tìm hiểu công cụ tìm kiếm và nghiên cứu những tiêu chí của việc nâng
cao thứ hạng trên công cụ tìm kiếm Google.
 Đánh giá thực trạng, hiệu quả Marketing Online của Thammyvienphuxuan.vn
trên các khía cạnh :
- Tìm hiểu thực trạng tình hình quảng bá website của thammyvienphuxuan.vn

1


- Ưu điểm, thành tựu, hạn chế và nguyên nhân của những hạn chế.
 Đề xuất những giải pháp để nâng cao hiệu quả Marketing Online của
thammyvienphuxuan.vn thông qua công cụ SEO :
- Hướng tới việc hoàn thiện hơn cho website thammyvienphuxuan.vn
- Có những đề xuất và hướng phát triển lâu dài một cách tiềm năng cho
website thammyvienphuxuan.vn về chất lượng sản phẩm, chất lượng phục vụ, việc
nắm bắt nhu cầu thị trường.
Đối tượng nghiên cứu :
- Website Thammyvienphuxuan.vn
- Đối tượng khách hàng đến thăm website và đã từng đặt dịch vụ tại
thammyvienphuxuan.vn
Phạm vi nghiên cứu :
- Xem xét, tìm hiểu các tính năng của website và lĩnh vực Marketing trong
xếp thứ hạng vị tri của các từ khóa trên công cụ tìm kiểm Google.
Trong quá trình thực hiện, em còn gặp nhiều khó khăn và không tránh khỏi
sai sót. Song, nhờ sự hướng dẫn nhiệt tình của cán bộ hướng dẫn tại cơ sở thực tập
cùng giáo viên hướng dẫn em đã giải quyết được vấn đề đặt ra. Một lần nữa, em xin
gửi lời cảm ơn sâu sắc đến ThS. Trần Thu Phương và ThS. Đỗ Văn Đại cùng cán bộ
hướng dẫn trực tiếp tại cơ sở thực tập – anh Nguyễn Văn Khánh đã tận tình giúp đỡ
em trong suốt quá trình làm đề tài.
Thái Nguyên, ngày 20 tháng 5 năm 2016
Sinh Viên

Nguyễn Thị Minh Huyền

2


Chương 1.
CƠ SỞ LÍ THUYẾT VỀ MARKETING ONLINE THÔNG QUA CÔNG CỤ
SEO ( SEARCH ENGINE OPTIMIZATION )
1.1. MỘT SỐ ĐỊNH NGHĨA, KHÁI NIỆM CƠ BẢN
1.1.1. Marketing là gì ?
Marketing truyền thống : Là một dạng hoạt động của con người nhằm thỏa
mãn nhu cầu và mong muốn thông qua trao đổi.
1.1.2. Marketing điện tử là gì ?
Marketing điện tử : là quá trình lập kế hoạch về sản phẩm, giá, phân phối và
xúc tiến đối với sản phẩm, dịch vụ và ý tưởng để đáp ứng nhu cầu của tổ chức và cá
nhân dựa trên các phương tiện điện tử và Internet.
Tóm lại, Marketing điện tử bao gồm tất cả các hoạt động để thỏa mãn nhu
cầu và mong muốn của khách hàng thông qua Internet và các phương tiện điện tử.
1.1.3. Công cụ SEO
SEO là viết tắt của Search Engine Optimization hay Search Engine
Optimizer – là quy trình tối ưu hóa tìm kiếm web nhằm tăng lượng truy cập đến
trang web từ các bộ máy tìm kiếm.
Mục tiêu của SEO là đưa trang web lên hàng đầu trong kết quả tìm kiếm theo
một số từ khóa cụ thể.
1.1.4. Quảng bá website
Theo thống kê, có đến >80% truy cập là qua các công cụ tìm kiếm. Thu hút
một lượng truy cập lớn là mục tiêu của tất cả các trang web.
Quảng bá website là việc đưa thông tin về sản phẩm và dịch vụ trên website
của doanh nghiệp vào các website tìm kiếm nổi tiếng như Google, Bing, Yahoo…và
những từ khóa sẽ nằm trong danh sách 20 kết quả tìm thấy đầu tiên khi tìm kiếm. Vì
vậy nếu website của doanh nghiệp không đứng trong Top 10 hay 20 kết quả đầu
tiên thì việc có mặt trên Internet hoàn toàn vô nghĩa.
Khi website của doanh nghiệp có thứ hạng cao trên các bộ máy tìm kiếm,
mang lại cho web những vị khách hàng mới một cách nhanh chóng và hiệu quả.

2


Khoảng 85% lượng truy cập vào các trang web trên toàn cầu là đến từ các bộ máy
tìm kiếm. Khoảng 74% người dùng Internet ở Việt Nam truy cập hàng ngày vào
trang web tìm kiếm Google, 14% truy cập vào Yahoo. Do vậy mà không nên bỏ qua
quảng bá trên Google.
1.2. CƠ SỞ LÝ THUYẾT VỀ MARKETING ONLINE THÔNG QUA CÔNG
CỤ SEO
1.2.1. Tổng quan về Marketing online
Hiện nay chúng ta sẽ thường nghe những từ ngữ như Digital Marketing,
Internet Marketing hay Online Marketing trôi nổi khắp nơi trên mạng và có rất
nhiều người sử dụng các từ này như các từ đồng nghĩa và có thể thay thế cho nhau
được. Nhưng trên thực tế thì Digital Marketing là một cụm từ mang ý nghĩa bao
hàm hơn và Marketing Online (hay Internet Marketing) chỉ là một phần của Digital
Marketing. Vậy chính xác thì Digital Marketing là gì?
“Digital Marketing là phương pháp quảng cáo sử dụng các thiết bị điện tử
như máy tính cá nhân, điện thoại thông minh, điện thoại di động, máy tính bảng và
thiết bị chơi game để tương tác với người dùng. Digital Marketing sử dụng những
công nghệ hoặc các nền tảng như websites, email, ứng dụng (cơ bản và trên di
động) và các mạng xã hội.”
Digital Marketing được chia làm 2 phần rất riêng biệt và rõ ràng đó là
Marketing Online (hay Internet Marketing) và Digital Advertising.

Như chúng ta có thể thấy trên graphic bên trên thì Online Marketing /
Internet Marketing bao gồm các kênh quảng cáo liên quan tới việc đòi hỏi phải
online hay nói cách khác là có kết nối mạng internet, trong khi đó thì Digital

3


Advertising thì lại chủ yếu là một số biện pháp quảng cáo mà trong đó bạn không
cần kết nối mạng.
1.2.1.1. Marketing online bao gồm những gì?
a, Search engine marketing (SEM)
SEM có 2 cách. Thứ nhất là Adwords, thứ 2 là SEO.
Adwords là chương trình quảng cáo trực tuyến của Google, cho phép bạn
tiếp cận những khách hàng mới và phát triển doanh nghiệp của mình.
Bất kể ngân sách của bạn là bao nhiêu hoặc lượng thời gian ít ỏi mà bạn có,
bạn có thể tiếp cận khách hàng mới và phát triển doanh nghiệp của mình bằng
chương trình quảng cáo trực tuyến của Google. Với Adwords bạn có thể chọn vị trí
quảng cáo của mình xuất hiện, đặt ngân sách thoải mái cho bạn ( không có cam kết
chi tiêu tối thiểu nào ) và dễ dàng đo lường tác động của quảng cáo của bạn.
SEO (search engine optimization) là hình thức tối ưu hóa từ khóa của
website cho search engine để được lọt vào top cao trong kết quả tìm kiếm của người
sử dụng. Bạn có thể tự SEO hay thuê SEO.
Cả 2 đều tăng lược truy cập của người dùng vào website bạn với nội dung họ
quan tâm. Nếu lượng truy cập vào website tăng thì tiềm năng khách hàng cũng sẽ
cao hơn. Ngày nay SEM là hình thức quảng cáo rất có giá trị trên internet cùng với
quảng cáo trên mạng xã hội.
b, Mobile Marketing: quảng cáo thông qua các thiết bị di động trong đó có
thể bao gồm việc sử dụng tổng đài nhắn tin hàng loạt, sử dụng đầu số kết hợp với
trò chơi tối ưu hóa trang web để hiển thị tốt hơn, quảng cáo push và banner trong
các ứng dụng hay trò chơi để khuyến khích người dùng cài đặt ứng dụng.
c, Email Marketing: quảng cáo bằng hình thức gửi email tới các khách hàng
có trong danh sách hoặc cơ sở dữ liệu và giới thiệu với họ về dịch vụ, sản phẩm hay
cập nhật tin tức.
d, Content Marketing: phương pháp quảng cáo bằng cách tạo ra hoặc đăng
tải những nội dung có khả năng tạo tương tác tốt với người dùng và qua đó gia tăng
traffic, pageviews hay tạo ra lợi nhuận.

4


e, Social Marketing: quảng cáo và truyền tải các thông điệp tới người dùng
thông qua các mạng xã hội như Facebook, Twitter, LinkedIn và để gia tăng sự nhận
biết thương hiệu.
f, Display: quảng cáo thông qua các dịch vụ cung cấp (publishers, ad
networks, ad exchange, DSP) với hình thức hiển thị banner trên các website trong
hệ thống của nhà cung cấp. Có thể tính theo CPM – CPC hoặc CPA tùy theo gói
của nhà cung cấp.
1.2.1.2. Một số lợi ích của Marketing online
Rút ngắn khoảng cách: Vị trí địa lý không còn là một vấn đề quan trọng.
Internet đã rút ngắn khoảng cách, các đối tác có thể gặp nhau qua không gian máy
tính mà không cần biết đối tác ở gần hay ở xa. Điều này cho phép nhiều người mua
và bán bỏ qua những khâu trung gian truyền thống.
Tiếp thị toàn cầu: Internet là một phương tiện hữu hiệu để các nhà hoạt
động marketing tiếp cận với các thị trường khách hàng trên toàn thế giới. Điều mà
các phương tiện marketing thông thường khác hầu như khong thể.
Giảm thời gian: Thời gian không còn là một yếu tố quan trọng. Những
người làm marketing trực tuyến có thể truy cập lấy thông tin cũng như giao dịch với
khách hàng 24/7.
Giảm chi phí: Chi phí sẽ không còn là gánh nặng. Chỉ với 1/10 chi phí
thông thường, Marketing trực tuyến có thể đem lại hiệu quả gấp đôi.
1.2.1.3. Tầm quan trọng của SEO trong Marketing online
Ngày nay SEO đang trở thành công cụ hỗ trợ đắc lực cho Marketing online.
SEO quan trọng bởi vì nó bao gồm hầu hết các lĩnh vực chính liên quan đến
Marketing trong kinh doanh và quảng cáo trực tuyến – nó sẽ tạo ra nhận thức, dẫn
đến việc mua sắm của khách hàng và sự trao đổi của khách hàng, và tối ưu hóa
những nỗ lực tiếp thị để hướng đến người mua.
Seo website đem đến cho bạn lưu lượng truy cập từ Google và khả năng
chuyển đổi cao từ những khách hàng có nhu cầu quan tâm đến các dịch vụ hay sản
phẩm mà bạn cung cấp cho họ.

5


Hơn thế nữa, nếu như bạn có một chiến thuật Seo website hợp lý, điều đó sẽ
đồng nghĩa lượng người truy cập vào pages của trang web luôn được duy trì một
cách ổn định. Đáng nói hơn những từ khóa có giá trị có khả năng cạnh tranh cao
luôn đem lại cho bạn lưu lượng truy cập cao và dồi dào cũng tỉ lệ chuyển đổi thành
công luôn đạt ở mức cao nhất từ các chiến lược marketing online.
Hầu hết các công ty xây dựng chiến lược Marketing trực tuyến đều quan tâm
tới SEO. Điều này là rất cần thiết cho sự thành công của một kế hoạch Marketing,
một kế hoạch SEO tốt có thể được hỗ trợ bởi một chiến dịch Marketing online thích
hợp: Email Marketing, Social Media Marketing …
Như vậy, SEO là một thành phần không thể thiếu trong chiến dịch Marketing
Online của doanh nghiệp. Việc thực hiện SEO kết hợp với kế hoạch marketing tổng
thể sẽ giúp doanh nghiệp đạt được hiệu quả tốt nhất.
1.2.2. Tổng quan bộ máy tìm kiếm
1.2.2.1. Bộ máy tìm kiếm hoạt động như thế nào?
Search Engine hay còn gọi là công cụ tìm kiếm, bộ máy tìm kiếm giúp người
xem tìm thấy những thông tin một cách liên quan nhất. Người dùng có thể tìm kiếm
thông tin theo từ khoá, hình ảnh, địa điểm… trên search engine. Khi nhận được câu
lệnh yêu cầu tìm kiếm, search engine sẽ phân tích yêu cầu đó, đánh giá, xếp hạng và
trả về kết quả liên quan nhất. Search engine hoạt động theo quy trình như sau :
Ban đầu, SE (Search Engine) sẽ gửi các Spider (hay còn gọi là con bọ, Crawler)
để tiến hành khảo sát một website khi nó được upload lên. Các Spider này được lập
trình để có thể tự động lần theo liên kết để đi đến các website khác nhau, sau khi dừng
lại ở một website nào đó, Spider này sẽ thu thập, đánh giá các thông tin trên website đó
trước khi tự động lần theo các liên kết đến các website khác…
Sau khi nhận được các thông tin từ Spider, SE có nhiệm vụ lưu trữ lại trước
khi phân tích chúng bằng các thuật toán riêng biệt để trả về các kết quả khi người
dùng truy vấn đúng vào nội dung. Ta có thể tham khảo cách thức làm việc chung
của SE tại hình dưới đây:

6


Hình 1.1: Tổng quan cách thức làm việc của bộ máy tìm kiếm
Trong đó:
Khảo sát – Crawl: là một giai đoạn rất quan trọng để search engine tham
quan, thu thập thông tin trên website của bạn. Search engine có những con bọ (spider
hay crawler) được lập trình để có thể tự động theo các liên kết (link) để mò đến các
website khác nhau, thu thập và đánh giá các thông tin trên website đó.
Lưu trữ - Index: là giai đoạn search engine lưu lại thông tin sau khi đã
crawl. Với khối lượng lưu trữ vô hạn, các search engine có thể chứa hàng tỉ kết quả
liên quan. Một trang web có thể được index nhanh hoặc chậm tuỳ thuộc vào tốc độ
crawl, độ trust của website và nhiều yếu tố khác.
Phân tích – Analysis: giai đoạn này search engine sẽ làm việc trên các dữ
liệu mà nó thu thập được. Sau đó tính toán độ liên quan của dữ liệu so với yêu
cầu của người dùng. Các search engine khác nhau có những thuật toán phân tích
khác nhau từ đây tạo ra sự khác biệt giữa các search engine. Giai đoạn phân tích
sẽ tạo tiền đề cho giai đoạn phía sau – Trả về kết quả.
Kết quả - Results: Các kết quả liên quan sẽ được hiển thị trong giai đoạn
này. Những kết quả liên quan thường được sắp ở phía trên, cao hơn những kết quả ít
liên quan. Mặc dù không phải lúc nào các kết quả cũng thoả mãn được yêu cầu của
người tìm kiếm. Nhưng cho đến hiện nay, người dùng khá hài lòng với những gì mà
search engine trả về.
Tuy bức tranh hoạt động của search engine bên ngoài nhìn chung khá đơn
giản nhưng bên trong là tập hợp rất nhiều thuật toán phức tạp. Search engine nào
thoả mãn nhiều nhất nhu cầu tìm kiếm người sử dụng sẽ được sử dụng rộng rãi và

7


phát triển mạnh mẽ trong tương lai. Ai là vua trong thị trường tìm kiếm trực tuyến đầy
tiềm năng này?
1.2.2.2. Giới thiệu về google.com
Hiện nay trên thế giới có rất nhiều search engine đang hoạt động. Trong đó,
phải kể đến ba chàng khổng lồ đang chi phối 97% thị phần tìm kiếm.

Hình 1.2: Biểu đồ thị phần search engine từ tháng 4 - 2013
Google là search engine được nhiều người sử dụng nhất với 84% số người sử
dụng. Tiếp theo là Yahoo 6% và Bing 8%, còn lại số phần trăm ít ỏi dành cho các
search engine khác.
Công cụ tìm kiếm là công cụ chuyên đưa ra những câu trả lời đáp ứng các
yêu cầu của người tìm kiếm. Công cụ tìm kiếm thu thập dữ liệu từ nhiều nguồn,
bằng nhiều phương pháp để đưa vào cơ sở dữ liệu, mỗi khi người sử dụng ra lệnh
tìm kiếm, công cụ tìm kiếm sẽ lục tìm trong cơ sở dữ liệu và hiển thị các kết quả
đáp ứng yêu cầu của người sử dụng lên màn hình máy vi tính.
Hiện nay, Google.com là trang web có lượng người truy cập nhiều nhất thế
giới. Google có mặt ở Việt Nam với tên Google.com.vn
Công cụ tìm kiếm Google là một phần mềm nhằm tìm ra các trang web trên
mạng Internet có nội dung theo yêu cầu người dùng dựa vào các thông tin mà
Google có. Cơ sở dữ liệu của Google cực lớn, việc tìm các tài liệu sẽ dựa trên các từ

8


khóa (Keyword) được người dùng gõ vào và trả về một danh mục các trang web có
chứa từ khóa mà Google tìm được.
Google sử dụng những thuật toán phức tạp để nâng cao hiệu quả tìm kiếm và
chiến thuật với những người luôn tìm cách tăng thứ hạng website bằng tiểu sảo. Mỗi
công cụ tìm kiếm như Google, MSN hay các công cụ tìm kiếm khác đều có một
thuật toán khác nhau để đánh giá các website và các thuật toán này đều tuyệt mật.
Nhiều doanh nghiệp rất chú ý đến quảng bá website qua công cụ tìm kiếm
Google. Google luôn nhấn mạnh “Không nên sử dụng các phương pháp giả tạo,
hãy tạo ra các trang web cho mọi người chứ không phải cho các công cụ tìm kiếm ”
cho các web thấy được việc không nên dùng những thủ thuật, lợi dụng khe hở mà
cố vươn tới các vị trí đầu tiên trong kết quả tìm kiếm mà nên tạo cho website một sự
thân thiện, dễ sử dụng, hấp dẫn không chỉ đối với khách hàng mà con giúp cho các
công cụ tìm kiếm tìm đến nhanh, ưu tiên trước trong kết quả tìm kiếm.
1.2.3. Cấu tạo chung các bộ máy tìm kiếm
Bộ máy tìm kiếm thường cấu tạo bởi 3 bộ phận đó là: Bộ thu thập thông tin,
Bộ lập chỉ mục và bộ tìm kiếm thông tin, được hoạt động theo mô hình sau:

Hình 1.3: Cấu tạo Search Engine
Robot – bộ thu thập thông tin: Robot được biết đến dưới nhiều tên gọi
khác nhau: spider, bot, crawler, hoặc web worm…Về bản chất robot chỉ là một
chương trình duyệt và thu thập thông tin từ các website trên mạng, nó tự động duyệt
qua các cấu trúc siêu liên kết và trả về các danh mục kết quả của công cụ tìm kiếm.

9


Những trình duyệt thông thường không được xem là robot do thiếu tính chủ động,
chúng chỉ duyệt web khi có sự tác động của con người.
Index – bộ lập chỉ mục: Các trang web sau khi thu thập về sẽ được phân tích,
trích chọn những thông tin cần thiết (thường là các từ đơn, từ ghép, cụm từ quan
trọng) để lưu trữ trong cơ sở dữ liệu nhằm phục vụ cho nhu cầu tìm kiếm sau này.
Search Engine – Bộ tìm kiếm thông tin: Tưởng tượng ta muốn tìm vài
quyển sách trong một thư viện rất lớn. Với sức lực cá nhân ta không thể xem qua
hết tất cả sách, vì vậy ta cần một danh mục sách. Tương tự, tồn tại hàng triệu trang
web trên thế giới và mỗi phút trôi qua số lượng được đẩy lên càng nhiều hơn, cho
dù ta có trong tay một công cụ lướt web tuyệt vời đến đâu cũng không thể duyệt hết.
Tuy nhiên, với sự trợ giúp của SE, ta có thể thậm chí xác định được vị trí của những
từ cần tìm trong các trang web khắp nơi trên thế giới.
1.2.3.1. Robot
Robot được chia làm 2 loại đó là: Robot thu thập thông tin, và robot chỉ mục.
a, Robot thu thập thông tin
Robot thu thập thông tin có nhiệm vụ:
Phân tích – thống kê - Statistical Analysis: Robot đầu tiên được dùng để
đếm số lượng web server, số tài liệu trung bình của một server, tỉ lệ các dạng file
khác nhau, kích thước trung bình của một trang web, độ kết dính…
Duy trì siêu liên kết – Maintenance: Một trong những khó khăn của việc duy
trì một siêu liên kết là nó liên kết với những trang bị hỏng (dead links) khi những trang
này bị thay đổi hoặc thậm chí bị xóa. Thật không may vẫn chưa có cơ chế nào cảnh báo
các bộ duy trì về sự thay đổi này. Trên thực tế khi các tác giả nhận ra tài liệu của mình
chứa những liên kết hỏng, họ sẽ thông báo cho nhau, hoặc thỉnh thoảng độc giả thông
báo cho họ bằng email. Một số robot có thể trợ giúp tác giả phát hiện các liên kết hỏng
cũng như duy trì các cấu trúc siêu liên kết cùng nội dung của một trang web. Chức
năng này lặp lại liên tục mỗi khi một tài liệu được cập nhật, nhờ đó mọi vấn đề xảy ra
sẽ được giải quyết nhanh chóng.
Ánh xạ địa chỉ web – Mirroring: Mirroring là một kỹ thuật phổ biến trong
việc duy trì các kho dữ liệu. Một ánh xạ (mirror) sẽ sao chép toàn bộ cấu trúc cây thư
mục và thường xuyên cập nhật những file bị thay đổi. Điều này cho phép nhiều người

10


cùng truy xuất một nguồn dữ liệu, giảm số liên kết bị thất bại, nhanh hơn và ít chi phí
hơn so với truy cập trực tiếp vào site thực sự chứa các dữ liệu này.
Phát hiện tài nguyên: Có lẽ ứng dụng thú vị nhất của robot là dùng nó để
phát hiện tài nguyên.Con người không thể kiểm soát nổi một khối lượng thông
tin khổng lồ trong môi trường mạng. Robot sẽ giúp thu thập tài liệu, tạo và duy
trì cơ sở dữ liệu, phát hiện và xoá bỏ các liên kết hỏng nếu có, kết hợp với công
cụ tìm kiếm cung cấp thông tin cần thiết cho con người.
Kết hợp các công dụng trên - Combined uses: Một robot có thể đảm nhận
nhiều chức năng như: vừa thống kê số lượng tài liệu thu được vừa tạo cơ sở dữ
liệu…. Tuy nhiên những ứng dụng như thế còn khá ít ỏi.
b, Robot chỉ mục – Robot Indexing
Trong quá trình thu thập thông tin phục vụ cho việc lập chỉ mục, ta cần giải
quyết vấn đề sau:
Trong môi trường mạng, robot lấy thông tin từ các site. Vậy robot sẽ bắt đầu
từ site nào? Điều này hoàn toàn phụ thuộc vào robot. Mỗi robot khác nhau có những
chiến lược khác nhau. Thường thì robot sẽ viếng thăm các site phổ biến hoặc những
site có nhiều liên kết dẫn đến nó.
Ai sẽ cung cấp địa chỉ của các site này cho robot? Có 2 nguồn: một là Robot
nhận các URL ban đầu từ user. Hai là Robot phân tích các trang web để lấy các
URL mới, đến lượt các URL này trở thành địa chỉ đầu vào cho robot. Quá trình này
được lặp lại liên tục.
Chọn dữ liệu nào trong tài liệu để lập chỉ mục? Quyết định chọn dữ liệu nào
trong tài liệu cũng hoàn toàn phụ thuộc vào robot, thường thì những từ được liệt kê
như sau được xem là quan trọng :
Trong các đề mục.
Được in đậm.
Trong URL.
Trong tiêu đề (quan trọng).
Trong phần miêu tả trang web (Description) .
Trong các thẻ dành cho hình ảnh (ALT).
11


Trong các thẻ chứa từ khóa.
Trong các text liên kết.
Một số robot lập chỉ mục trên tiêu đề, hoặc một số đoạn văn bản đầu tiên
hoặc toàn bộ tài liệu (full text). Một số khác lại lập chỉ mục trên các thẻ META
(META tags) hoặc các thẻ ẩn, nhờ vậy tác giả của trang web được quyền ấn định từ
khoá cho tài liệu của mình. Tuy nhiên chức năng này bị lạm dụng quá nhiều do đó
các thẻ META không còn giữ được giá trị ban đầu của chúng nữa (Black Hat SEO).
1.2.3.2 Index – bộ lập chỉ mục
Mô hình xử lý tổng quát của một hệ thống lập chỉ mục

Hình 1.4: Mô hình xử lý tổng quát hệ thống lập chỉ mục
Lập chỉ mục là quá trình phân tích và xác định các từ, cụm từ thích hợp cốt lõi
có khả năng đại diện cho nội dung của tài liệu. Như vậy, vấn đề đặt ra là phải rút trích
ra những thông tin chính, có khả năng đại diện cho nội dung của tài liệu.
Thông tin này phải “vừa đủ”, nghĩa là không thiếu để trả ra kết quả đầy đủ so
với nhu cầu tìm kiếm, nhưng cũng phải không dư để giảm chi phí lưu trữ và chi phí
tìm kiếm và để loại bỏ kết quả dư thừa không phù hợp.

12


Việc rút trích này chính là việc lập chỉ mục trên tài liệu. Trước đây, quá trình
này thường được các chuyên viên đã qua đào tạo thực hiện một cách “thủ công “
nên có độ chính xác cao. Nhưng trong môi trường hiện đại ngày nay, với lượng
thông tin khổng lồ thì việc lập chỉ mục bằng tay không còn phù hợp, phương pháp
lập chỉ mục tự động mang lại hiệu quả cao hơn.
Một thủ tục lập chỉ mục tự động cơ bản:
Step of tokenization: Tách văn bản ra thành các chuỗi nhờ vào khoảng
trắng, mỗi chuỗi xem như là một từ.
Step of removal of stop words: bỏ những từ thường xuyên xuất hiện trong
hầu hết các tài liệu nhưng lại không quan trọng trong các tài liệu như tính từ, đại từ.
Step of stemming: loại bỏ các hậu tố (Suffixes) để đưa về các từ gốc.
Các từ thu được sẽ được lập chỉ mục. Tuy nhiên hai bước đầu cũng cần cho
quá trình lập chỉ mục cho các tài liệu tiếng Việt, bước thứ ba không cần vì tiếng
Việt thuộc dòng ngôn ngữ đơn thể.
Phương pháp lập chỉ mục
Phương pháp lập chỉ mục gồm hai phần chính yếu sau:
Đầu tiên là xác định các mục từ, khái niệm mà có khả năng đại diện cho văn bản
sẽ được lưu trữ (bao gồm cả việc tách từ, loại bỏ stop-word, xử lý hậu tố…)
Thứ hai là xác định trọng số cho từng mục từ , trọng số này là giá trị phản
ánh tầm quan trọng của mục từ đó trong văn bản.
Xác định mục từ quan trọng cần lập chỉ mục:
Mục từ hay còn gọi là mục từ chỉ mục, là đơn vị cơ sở cho quá trình lập chỉ
mục. Mục từ có thể là từ đơn, từ phức hay một tổ hợp từ có nghĩa trong một ngữ
cảnh cụ thể. Ta xác định mục từ của 1 văn bản dựa vào chính nội dung của văn bản
đó, hoặc dựa vào tiêu đề hoặc tóm tắt nội dung của văn bản đó.
Hầu hết việc lập chỉ mục tự động bắt đầu với việc khảo sát tần số xuất hiện
của từng loại từ riêng rẽ trong văn bản. Nếu tất cả các từ xuất hiên trong tập tài liêu
với những tần số băng nhau, thì không thể phân biệt các mục từ theo tiêu chuẩn
định lượng. Tuy nhiên, trong văn bản ngôn ngữ tự nhiên, tần số xuất hiện của từ có

13


tính thất thường, do đó những mục từ có thể được phân biệt bởi tần số xuất hiên của
chúng.
Xác định trọng số cho mục từ:
Trọng số của mục từ là sự tần xuất xuất hiện của mục từ trong toàn bộ tài
liệu. Phương pháp thường được sử dụng để đánh giá trọng số của từ là dựa vào
thống kê, với ý tưởng là những từ thường xuyên xuất hiện trong tất cả các tài liệu
thì “ít có ý nghĩa hơn” là những từ tập trung trong một số tài liệu.
1.2.3.3. Search Engine – bộ tìm kiếm thông tin
Vì sao ta cần một công cụ tìm kiếm thông tin? Tưởng tượng ta muốn tìm vài
quyển sách trong một thư viện rất lớn. Với sức lực cá nhân ta không thể xem qua
hết tất cả sách, vì vậy ta cần một danh mục sách. Tương tự, tồn tại hàng triệu trang
web trên thế giới và mỗi phút trôi qua số lượng được đẩy lên càng nhiều hơn, cho
dù ta có trong tay một công cụ lướt web tuyệt vời đến đâu cũng không thể duyệt hết.
Tuy nhiên, với sự trợ giúp của SE, ta có thể thậm chí xác định được vị trí của những
từ cần tìm trong các trang web khắp nơi trên thế giới.
a, Các phương thức tìm kiếm
Tìm kiếm theo từ khóa:
Đây là phương pháp được áp dụng với hầu hết các search engine. Trừ khi tác
giả của trang web xác định từ khóa cho tài liệu của mình, ngược lại điều này phụ
thuộc vào search engine. Như vậy các search engine sẽ tự mình chọn và đánh chỉ
mục. Một số site lập chỉ mục cho tất cả các từ có trong một trang web, một số khác
chỉ chọn một số đoạn văn bản.
Các hệ thống đánh chỉ mục trên toàn văn bản (full-text indexing systems)
đếm số lần xuất hiện của mỗi từ trong tài liệu ngoại trừ các từ stopword. Có những
công cụ tìm kiếm còn phân biệt cả chữ hoa lẫn chữ thường.
Những khó khăn khi tìm theo từ khóa: Search engine thường gặp rắc rối với
những từ đồng âm khác nghĩa hoặc những từ có các biến thể khác nhau do có tiền tố
và hậu tố. Bên cạnh đó search engine cũng không thể trả về các tài liệu chứa những
từ đồng nghĩa với các từ trong câu truy vấn.

14


Tìm kiếm theo ngữ nghĩa:
Không giống các hệ thống tìm theo từ khoá, hệ thống tìm theo ngữ nghĩa sẽ
‘đoán’ ý muốn của người dùng thông qua câu chữ. Tìm theo ngữ nghĩa hoạt động
dựa trên hình thức gom nhóm tài liệu, phức tạp hơn thì dựa vào ngôn ngữ học, các
thuyết về trí tuệ nhân tạo, tiếp cận dựa vào phương pháp tính toán bằng cách đếm số
lần xuất hiện của các từ quan trọng. Khi nhiều từ hoặc những cụm từ có nghĩa đặt
gần nhau trong tài liệu thì cho rằng chúng đang ám chỉ một chủ đề nào đó.

Hình 1.5: Hệ thống tự động đoán hành vi tìm kiếm
b. Các chiến lược tìm kiếm
Mọi người đều nhận xét rằng web là nơi mà ta luôn có được thông tin về bất kỳ
chủ đề gì. Nhưng kết quả cuối cùng thường là lãng phí thời gian cho những URL vô ích.
Do đó đã đến lúc ta nghĩ đến các chiến lược tìm kiếm.
Ta khởi đầu với một đống thông tin trên một chủ đề khá rộng?
Hoặc ta đã hình dung được cụ thể những gì cần tìm?

15


Hay ta muốn tìm địa chỉ của ai đó?
Nếu phạm vi quan tâm của ta quá rộng, ta nên xem xét các thư mục web
(web directory). Nếu sau đó ta thu hẹp phạm vi cần tìm, hãy xem xét việc lựa chọn
một công cụ tìm kiếm thích hợp.
Ví dụ: Chỉ với từ khóa “học” ta có thể có “học tiếng anh”, “học tài
chính”, “học ngân hàng”, “học guitar... nhưng với từ khóa rõ nghĩa hơn là học
tiếng anh online, học tiếng anh cơ bản...
1.2.4. Hệ thống Rank
1.2.4.1. Google PageRank
a, Google PageRank là gì?
Google PageRank là chỉ số đáng tin cậy chỉ giá trị của một trang web. Google
đánh giá và xếp hạng các trang web bằng cả hai phương pháp tự động và thủ công dựa
trên hơn 100 chỉ số chính với những thuật toán xuất sắc.
Một vài chỉ số quan trọng quyết định Google PageRank của một trang web:
độ hữu dụng của thông tin trên trang web, độ phổ biến của trang web, chất lượng kỹ
thuật...
Google PageRank được chia làm 10 bậc và được biểu hiện bằng vạch màu
xanh trên nền trắng:
dần từ 1 đến 10.

. Giá trị của mỗi trang web theo Google PageRank tăng

Thuật ngữ PageRank™ là một thương hiệu được bảo hộ của Google, do
Larry Page và Sergey Brin phát triển tại trường đại học Stanford của Mỹ trong một
dự án nghiên cứu về công cụ tìm kiếm năm 1995.
b, Google PageRank đem lại lợi ích gì?
Google PageRank trước năm 2014 được coi là chỉ số đáng tin cậy đánh giá
mức độ quan trọng mỗi trang web. Một trang web có chỉ số Google PageRank cao
sẽ đem lại ấn tượng đáng tin cậy cho khách truy cập, điều này đặc biệt có ý nghĩa
với các website kinh doanh thương mại điện tử. Tuy nhiên sau tháng 1 năm 2014
sau nhiều lần Google cập nhật thuật toán của mình giá trị Page Rank hầu như không
còn nhiều giá trị, nhưng Google vẫn sử dụng PageRank để đánh giá ngầm một
website, mặc dù giá trị đã giảm so với trước đó.

16


Google PageRank ảnh hưởng trực tiếp tới vị trí hiển thị của mỗi trang web
khi cạnh tranh thứ hạng hiển thị trong danh sách kết quả tìm kiếm của Google. Một
trang web có PageRank cao dễ xuất hiện trên đầu danh sách kết quả tìm kiếm của
Google hơn.
c, Tăng Google PageRank như thế nào?
Về cơ bản, theo các chuyên gia của Google: "Không được sử dụng các
phương pháp giả tạo, hãy tạo ra các trang web cho mọi người chứ không phải cho
các công cụ tìm kiếm". Và việc đó là việc cung cấp nội dung thực sự hữu ích, cung
cấp trải nghiệm cho người dùng thật sự. Khi website đã có sự tin tưởng thì Google
sẽ nâng hạng tin cậy của website lên.
Tăng thứ hạng trong danh sách kết quả tìm kiếm của Google là phương pháp
tăng PageRank rất hiệu quả vì vừa tăng độ phổ biến các trang web, vừa tăng lượng
khách truy cập.
Cấu trúc website, cấp bậc cần rõ ràng, nội dung thông tin cần phong phú, hữu ích.
Website không được chứa các liên kết lỗi, các lỗi HTML, lỗi câu lệnh.
Đăng ký website vào các danh bạ uy tín cũng như các website chất lượng
khác để tăng độ phổ biến.
1.2.4.2. Alexa Rank
a, Alexa Rank là gì ?
Alexa Rank là thước đo mức độ phổ biến của các website. Chỉ số thứ hạng
của mỗi website được Alexa kết hợp đánh giá từ 2 yếu tố là: số trang web người
dùng xem (Page Views) và số người truy cập website (Reach).
b, Alexa Rank mang lại lợi ích gì?
Chỉ số thứ hạng Alexa của một website cao được hiểu là website đó có đông
người truy cập, phần nào đem lại cho website ấn tượng sống động và uy tín.
Trong thị trường quảng cáo trực tuyến, Alexa Rank có thể được sử dụng để
đánh giá giá trị quảng cáo.
Chỉ số Alexa Rank là thước đo ghi nhận thành quả lao động của các
webmaster với cộng đồng và là một công cụ rất hữu ích giúp các webmaster quản trị
website hiệu quả.
17


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay

×