Niên khóa: 2012-2016
SEO WEBSITE CHO THUÊ XE CHO CÔNG TY TNHH DU LỊCH VÀ VẬN TẢI MINH QUÂN
VIỆN ĐẠI HỌC MỞ HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
CHU VĂN HIẾU
SEO WEBSITE CHO THUÊ XE DỰ ÁN CHUYÊN
CUNG CẤP XE ĐƯA ĐÓN CÔNG NHÂN VIÊN CHO
CÔNG TY TNHH DU LỊCH VÀ VẬN TẢI MINH
QUÂN
Chuyên ngành: Công nghệ thông tin
ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC
Hà Nội - 2016
VIỆN ĐẠI HỌC MỞ HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
CHU VĂN HIẾU
SEO WEBSITE CHO THUÊ XE DỰ ÁN CHUYÊN
CUNG CẤP XE ĐƯA ĐÓN CÔNG NHÂN VIÊN CHO
CÔNG TY TNHH DU LỊCH VÀ VẬN TẢI MINH
QUÂN
Chuyên ngành: Công nghệ thông tin
Giảng viên hướng dẫn:
Trần Duy Hùng
ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC
Hà Nội - 2016
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
VIỆN ĐẠI HỌC MỞ HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
Độc lập – Tự do – Hạnh phúc
Hà Nội, ngày 6 tháng 9 năm 2016
NHIỆM VỤ CỦA ĐỒ ÁN TỐT NGHIỆP
Họ và tên: Chu Văn Hiếu
Giới tính: Nam
Ngày, tháng, năm sinh: 31/08/1994
Nơi sinh: Hà Nội
Ngành: Công nghệ thông tin
Mã số: 12A10010171
Lớp hành chính:
1210A01
1. TÊN ĐỀ TÀI
SEO website Cho Thuê Xe dự án chuyên cung cấp xe đưa đón công nhân
viên cho Công ty TNHH du lịch và vận tải Minh Quân.
Website: http://dulichphuongdong.vn
2. NHIỆM VỤ VÀ NỘI DUNG
Đưa website lên TOP 10 tìm kiếm Google khi người dùng truy vấn tìm kiếm.
3. CÁN BỘ HƯỚNG DẪN: Th.S. Trần Duy Hùng
Nội dung và đề cương Đồ án đã được Hội đồng chuyên ngành thông qua.
GIẢNG VIÊN HƯỚNG DẪN
KHOA CÔNG NGHỆ THÔNG TIN
LỜI NÓI ĐẦU
Ngày nay, trong xã hội đang có những bước phát triển đột phá về lĩnh vực
công nghệ thì việc tìm kiếm thông tin nhanh chóng, thuận tiện nhất trên
Internet đang được sử dụng rất phổ biến. Để tiết kiệm thời gian hầu hết mọi
người đều sử dụng các công cụ tìm kiếm online nhằm đạt được mục tiêu tìm
kiếm của mình. Theo thống kê thì Google là công cụ tìm kiếm thông dụng
nhất hiện nay. Vậy làm thế nào để những thông tin chúng ta cần cung cấp cho
người tìm kiếm được xuất hiện trong bộ máy tìm kiếm Google và xuất hiện ở
những TOP đầu công cụ tìm kiếm này, điều này là một bài toán lớn đặt ra cho
rất nhiều cá nhân doanh nghiệp cần phải giải quyết.
Trong đề tài này, tôi sẽ áp dụng kiến thức, kỹ năng về SEO của mình để
SEO cho một website trong lĩnh vực Cho Thuê Xe. Một dự án thực tế mà tôi
đang triển khai thực hiện tại công ty mình (Công ty TNHH du lịch và vận tải
Minh Quân).
Trong quá trình triển khai không thể nào tránh khỏi được những thiếu sót, vì
vậy tôi kính mong các Thầy cô kịp thời đóng góp ý kiến để tôi có thể hoàn
thành tốt nhất.
Tôi chân thành cảm ơn Khoa Công nghệ Thông Tin – Viện Đại Học
Mở Hà Nội, giảng viên hướng dẫn TS.Trần Duy Hùng và các thầy cô trong
nhà trường đã tạo điều kiện và nhiệt tình giúp đỡ tôi có cơ hội thực hiện đề tài
này.
Tôi xin chân thành cảm ơn!
MỤC LỤC
CHƯƠNG 1. TỔNG QUAN ........................................................................ 1
1.1
Đặt vấn đề ......................................................................................... 1
1.2 Mục tiêu cần đạt được ..................................................................... 2
1.2.1 Về lý thuyết ................................................................................ 2
1.2.2 Về ứng dụng ................................................................................ 3
1.3
Phương pháp nghiên cứu và giải quyết vấn đề ............................... 3
CHƯƠNG 2. KHẢO SÁT HIỆN TRẠNG .................................................. 4
CHƯƠNG 3. CƠ SỞ LÝ THUYẾT............................................................. 7
3.1 Tổng quan bộ máy tìm kiếm. ........................................................... 7
3.1.1 Bộ máy tìm kiếm hoạt động như thế nào? .................................... 7
3.1.2 Giới thiệu về các search engine thông dụng. ................................ 8
3.2 Cấu tạo chung của các bộ máy tìm kiếm. ....................................... 9
3.2.1 Robot_ Bộ thu nhập thông tin .................................................... 10
3.2.2 Index_Bộ lập chỉ mục ................................................................ 10
3.2.3 Search Engine_Bộ tìm kiếm thông tin ........................................ 10
3.3
Hệ thống RANK ............................................................................. 11
3.4 Tìm hiểu về SEO ............................................................................ 11
3.4.1 SEO là gì? .................................................................................. 11
3.4.2 Tại sao cần SEO? ....................................................................... 12
3.4.3 Từ khóa trong SEO là gì?........................................................... 12
3.5
Một số thuật ngữ seo cơ bản .......................................................... 13
3.6 Các yếu tố quyết định đến thứ hạng của một website .................. 19
3.6.1 Yếu tố liên quan đến page .......................................................... 19
3.6.2 Yếu tố xếp hạng liên quan đến Domain...................................... 20
3.6.3 Yếu tố liên quan đến độ phổ biến của domain. ........................... 21
3.6.4 Yếu tố liên quan đến mạng xã hội .............................................. 21
3.6.5 Yếu tố liên quan đến việc sử dụng từ khóa trong URL ............... 22
3.6.6 Yếu tố Onpage ........................................................................... 22
CHƯƠNG 4. TỔNG HỢP CÁC THUẬT TOÁN CƠ BẢN GOOGLE ... 24
4.1 Thuật toán google panda ( Gấu trúc ) ........................................... 24
4.1.1 Thời gian người dùng ở trang web của bạn ................................ 25
4.1.2 Người dùng cập thường xuyên ................................................... 25
4.1.3 Người dùng quay lại trang web .................................................. 25
4.1.4 Mạng xã hội ............................................................................... 25
4.2 Thuật toán google penguin ( Chim cánh cụt ) .............................. 26
4.2.1 Xây dựng backlink không tự nhiên ............................................ 27
4.2.2 Backlink từ những website hoặc page chất lượng kém ............... 28
4.3 Thuật toán Zebra ( Ngựa vằn )...................................................... 29
4.3.1 Các điều cần lưu ý với thuật toán Zebra ..................................... 29
4.3.2 Một số gợi ý để tránh thuật toán Zebra....................................... 30
4.4
Thuật toán Hummingbird ( Chim ruồi )....................................... 30
4.5
Thuật toán Payday loan ................................................................. 32
4.6
Thuật toán Pigeon (Chim bồ câu) ................................................. 33
4.7
Thuật toán Mobile-Friendly Ranking ........................................... 35
CHƯƠNG 5. QUY TRÌNH LÀM SEO ..................................................... 37
CHƯƠNG 6. KHẢO SÁT THÔNG TIN NGƯỜI DÙNG ........................ 39
6.1
Thành phần người sử dụng ........................................................... 39
6.2
Đối thủ cạnh tranh và hướng đi của website ................................ 39
6.3 Xây dựng Website .......................................................................... 39
6.3.1 Chọn tên miền ............................................................................ 39
6.3.2 Chọn Hosting ............................................................................. 40
6.3.3 Mã nguồn phát triển ................................................................... 41
6.4 Các phương pháp tối ưu hóa Website ........................................... 42
6.4.1 Tối ưu hóa từ khóa (keyword) .................................................... 42
6.4.2 Đề xuất biện pháp tốt nhất cho
....................................... 43
6.5
Chiến dịch quảng bá Website ........................................................ 55
KẾT QUẢ ĐẠT ĐƯỢC ............................................................................. 57
DANH MỤC HÌNH ẢNH
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
Hình
1. Quá trình nghiên cứu được chia ra làm 4 giai đoạn ........................... 4
2. Quy trình hoạt động của SE .............................................................. 7
3. Bộ máy tìm kiếm .............................................................................. 9
4. Cấu tạo chung của bộ máy tìm kiếm ................................................. 9
5. Yếu tố liên quan đến page............................................................... 19
6. Yếu tố xếp hạng liên quan đến Domain .......................................... 20
7. Yếu tố lien quan đến độ phổ biến của domain................................. 21
8. Yếu tố lien quan đến mạng xã hội ................................................... 21
9. Yếu tố liên quan đến việc sử dụng từ khóa trong URL.................... 22
10. Yếu tố Onpage .............................................................................. 22
11. Thuật toán google panda ............................................................... 24
12. Thuật toán google penguin............................................................ 26
13. Thuật toán Zebra........................................................................... 29
14. Thuật toán Hummingbird .............................................................. 31
15. Thuật toán payday loan ................................................................. 32
16. Thuật toán Pigeon ......................................................................... 33
17. Thuật toán Mobile-Friendly Ranking ............................................ 35
18. Tối ưu hóa website từ Seoquake ................................................... 43
19. Tối ưu cho thiết bị di động ............................................................ 45
20. Meta Description .......................................................................... 46
21. Cấu trúc URL tối ưu ..................................................................... 47
22. Giao diện file robots.txt ................................................................ 49
23. Sử dụng công cụ để tối ưu nội dung Onpage................................. 51
24. Minh chứng số 01 ......................................................................... 52
25. Minh chứng số 02 ......................................................................... 52
26. Minh chứng số 03 ......................................................................... 53
27. Minh chứng số 04 ......................................................................... 53
28. Backlink từ các website trỏ về ...................................................... 55
29. Đặt Social bookmarks lên trang web ............................................. 56
30. Kiểm tra từ khóa trực tiếp trên Google.......................................... 57
31. Kiểm tra từ khóa trực tiếp trên Google.......................................... 57
32. Kiểm tra từ khóa trực tiếp trên Google.......................................... 58
33. Kết quả kiểm tra từ Tool check ..................................................... 58
1
CHƯƠNG 1. TỔNG QUAN
1.1 Đặt vấn đề
Ngành công nghệ thông tin trong những năm gần đây có một sức phát
triển vượt bậc và có những thành tựu to lớn được ứng dụng rộng rãi trong
nhiều lĩnh vực của đời sống. Cùng với xu hướng phát triển của các phương
tiện truyền thông đại chúng như báo chí, radio, ti vi… là sự phát triển bùng nổ
của internet. Truy cập internet chúng ta có thể tìm kiếm được một kho công
nghệ thông tin khổng lồ phục vụ cho mọi nhu cầu thiết yếu. Hiện nay, xu
hướng mọi người lên internet tìm kiếm, mua bán hàng hóa, trên mạng ngày
càng phổ biến. Câu hỏi đặt ra ở đây là thông qua đâu mà họ có thể tìm kiếm
cái mà họ đang cần?
Trên thế giới nói chung và tại Việt Nam hiện nay nói riêng, hầu hết
những người dùng internet đều lựa chọn cho mình một công cụ tìm kiếm
(Search Engine) hàng ngày. Theo thông kê cho thấy, Google đang là kênh
thông tin chính mà khách hàng tìm kiếm đến các sản phẩm, dịch vụ…, Nắm
bắt được xu hướng này, các nhà kinh doanh, các doanh nghiệp đã đưa các sản
phẩm, dịch vụ tập trung chủ yếu làm thân thiện và được Google ưu tiên nhất
để khách hàng có thể tìm kiếm được. Nhưng khi một khách hàng tìm kiếm
một sản phẩm trên công cụ tìm kiếm Google thì họ thường chú ý tới những
kết quả tìm kiếm được ở trang đầu tiên. Một điều đặt ra ở đây đối với các nhà
kinh doanh, doanh nghiệp là làm thế nào để sản phẩm, dịch vụ của họ xuất
hiện lên những trang đầu đó? Chính vì vậy các biện pháp giúp cho các
website giới thiệu về sản phẩm dịch vụ của họ lên được TOP của những
Search Engine đã được phát triển, đó chính là tối ưu hóa công cụ tìm kiếm
(SEO – Search Engine Optimization).
SEO vô cùng quan trọng đối với bất kể doanh nghiệp quy mô lớn nhỏ do
các lý do sau:
+ Theo thống kê có đến hơn 2/3 người dùng internet luôn sử dụng
công cụ tìm kiếm. Và có đến 78% người dùng mạng Internet (Hiện nay
ở Việt nam là 35 triệu người) thường xuyên dùng Google để tra cứu trước
khi mua bán sản phẩm hay dịch vụ cũng như tìm thông tin đáp ứng nhu cầu
mua sắm, học tập, vui chơi, giải trí, tìm kiếm thông tin….
2
+ Chi phí cho SEO sớm sẽ giảm tới 90% chi phí Marketing. Như công ty
Vatgia hầu như 100% thương hiệu hiện nay có được là từ SEO.
+ SEO là giai đoạn bắt buộc trong Online Marketing ở phân mục tiếp
thị đáp ứng nhu cầu search và nó quyết định hành vi chi tiêu của người dùng
Internet.
+ Chi phí cho SEO có hiệu quả lâu bền và càng dài thì ngân sách chi cho nó
càng giảm.
Chính vì đa phần người dùng đến 1 website đều thông qua công cụ tìm
kiếm nên nếu bỏ qua SEO đồng nghĩa với việc bạn mất tiền mỗi ngày cho
website của đối thủ cạnh tranh. Không người dùng nào đủ kiên nhẫn xem quá
nhiều kết quả sau khi thực hiện tìm kiếm trên SE.
Nếu website của bạn không nằm trong top 30 – top 10, khách hàng sẽ
không hề biết website của bạn tồn tại.
SEO là hoạt động không thể thiếu đối với bất kỳ . web nào, nó là con
đường để trở thành một. web được nhiều người biết đến.Các phương pháp
quảng cáo truyền thống càng bị bão hoà đối, chi phí cao nhưng hiệu quả lại
giảm sút. Nhất là trong giai đoạn khủng hoảng hiện nay, khi mà hiệu quả của
việc quảng cáo phải được đặt lên hàng đầu. SEO có rất nhiều ưu điểm so với
các phương pháp quảng bá truyền thống như: người dùng không phải độc
thoại, có thể tiếp cận trao đổi thông tin trực tiếp; linh hoạt hơn trong phân loại
người dùng và đặc biệt là Webmaster có thể quản lý được thông tin khách
hàng...Với rất nhiều ưu điểm mà truyền hình, báo giấy... không có được,
Internet sẽ luôn là lựa chọn hàng đầu.
1.2
Mục tiêu cần đạt được
1.2.1 Về lý thuyết
Sau khi hoàn thành luận văn, sinh viên có các kĩ năng sau:
- Tìm hiểu bộ máy tìm kiếm.
- Hiểu thế nào là SEO, các biện pháp để tiến hành SEO một website.
3
1.2.2 Về ứng dụng
Sau khi áp dụng lý thuyết đạt được vào thực tiễn để:
- Đưa website vào TOP 10 của bộ máy tìm kiếm với bộ từ khóa “thuê xe đưa
đón công nhân”, ”thuê xe đưa đón nhân viên”, “dịch vụ xe đưa đón công nhân
viên”.
- Phương pháp duy trì top 10 khi SEO đã thành công.
1.3 Phương pháp nghiên cứu và giải quyết vấn đề
Việc đầu tiên trước khi SEO một website đã được định hướng đúng đắn
bằng những ý tưởng độc đáo và mã nguồn tốt thì chúng ta phải biết được SEO
là gì? Và các phương pháp lựa chọn những thành phần hỗ trợ cho website
đó.Một website được SEO tốt khi và chỉ khi webmaster có được hiểu biết
đúng đắn, tránh rơi vào tình trạng Black Hat SEO.
Nhìn chung, quá trình nghiên cứu được phân thành 04 giai đoạn, các
giai đoạn này được thực hiện liên tục cho đến khi SEO thành công.
4
CHƯƠNG 2. KHẢO SÁT HIỆN TRẠNG
Có được định hướng đúng đắn bằng những ý tưởng độc đáo mã nguồn hợp
lý thì ta phải nắm được SEO là gì và lựa chọn đúng phương pháp để áp dụng
cho chiến dịch SEO một cách hợp lý nhất.
Hình 1. Quá trình nghiên cứu được chia ra làm 4 giai đoạn
Bước 1: Xây dựng ý tưởng, lựa chọn mã nguồn, xây dựng website có nội
dung hấp dẫn phù hợp với sản phẩm đang cung cấp.
Bước 2: Bắt đầu xây dựng website cả về mã nguồn lẫn nội dung, tối ưu hóa
website
Bước 3: Thống kê lượng tìm kiếm và lưu lượng người truy cập
Bước 4: Theo dõi các báo cáo cụ thể
5
Kế hoạch làm việc
Tuần
Công việc
1–3
Nghiên cứu về Search Engines, cách thức hoạt động, cách
thức thu thập thông tin.
4–6
Nghiên cứu về SEO, các cách giải quyết vấn đề về SEO.
8 – 15
Tối ưu hóa website.
Quảng bá website dựa trên các mạng xã hội.
Phân tích theo dõi bằng các công cụ miễn phí của các
Search Engines cung cấp. Xác định hướng đi đúng đắn cho
Website.
16
Theo dõi, điều chỉnh từ khóa, các nội dung không phù hợp
17
Viết báo cáo.
18
Hoàn thành.
Bảng 1: Kế hoạch làm việc
Bố cục
Chương 1: Tổng quan.
Tại chương này, tác giả sẽ đề cập đến các khái niệm cơ bản về SEO,
các hiểu biết ban đầu về SEO.
Trong chương này, tác giả giới thiệu đề tài luận văn là: “Tìm hiểu và ứng
dụng
SEO
–
Search
Engine
Optimization
vào
website
http://dulichphuongdong.vn”
Chương 2: Cơ sở lý thuyết.
Về cơ sở lý thuyết, tác giả tìm hiểu cách thức làm việc chung của các
bộ máy tìm kiếm, các cách thức thu thập thông tin, cách thức để một bộ máy
tìm kiếm có thể thấy được . web. Trong chương này, tác giả cũng giới thiệu
về hai phương thức đánh giá thứ hạng của website là Alexa và GoogleRank,
hai phương thức này đã và đang là thước đo quan trọng trong việc phát triển
6
web. Cũng trong chương này, tác giả giới thiệu SEO, giúp cho người đọc có
cái nhìn rõ ràng hơn về SEO.
Chương 3: Ứng dụng.
Sau khi đã tìm hiểu và nắm rõ các phương thức tìm kiếm, các tiêu chí
đánh giá xếp hạng tại Chương 2, tác giả áp dụng những hiểu biết trên cơ sở lý
thuyết đó để bắt đầu SEO web http://dulichphuongdong.vn.
Tối ưu hóa web http://dulichphuongodng.vn cho công cụ tìm kiếm
Google. Vì vậy, ở chương này, chúng ta sẽ nghiên cứu các phương pháp cơ
bản nhất, chính qui nhất để có thể tối ưu hóa một website, nhằm đưa website
lên các thứ hạng cao khi người dùng truy vấn. Sau khi đã áp dụng các phương
pháp cơ bản và chính qui, tác giả sẽ thống kê các số liệu và so sánh lúc chưa
áp dụng SEO và sau khi áp dụng SEO.
Một số phương pháp, kĩ năng mềm mà tác giả đã áp dụng để SEO
thành công trang web.
Chương 4: Kết luận – hướng phát triển.
Nội dung của chương 4 sẽ là tổng hợp kết quảcác công việc đã làm ở các
chương trước. Các kết quả đã đạt được sau khi hoàn thành luận văn. Hướng
phát triển, đề xuất các phương pháp đễ giữ các vị trí cao khi SEO thành công,
cũng như cách thức quảng bá website đểcó thể thu lợi nhuận, tự nuôi sống
website.
7
CHƯƠNG 3. CƠ SỞ LÝ THUYẾT
3.1 Tổng quan bộ máy tìm kiếm.
3.1.1 Bộ máy tìm kiếm hoạt động như thế nào?
Search Engine (SE) hay còn được gọi là công cụ tìm kiếm, bộ máy tìm
kiếm giúp người xem tìm thấy những thông tin môt cách liên quan nhất.
Người dùng có thể tìm kiếm thông tin theo từ khóa, hình ảnh, địa điểm… trên
SE. Khi nhận được lệnh yêu cầu tìm kiếm , SE sẽ phân tích yêu cầu đó, đánh
giá, xếp hạng và trả về kết quả liên quan nhất.
Quy trình hoạt động của SE:
Hình 2. Quy trình hoạt động của SE
Khảo sát_Crawl: Là một giai đoạn rất quan trọng để SE tham quan, thu
thập thông tin trên website của bạn. SE có những con bọ được lập trình để
có thể tự động theo các liên kết (link) để mò đến các website khác nhau,
thu thập và đánh giá các thông tin trên website đó.
Lưu trữ_Index: là giai đoạn được SE lưu lại thông tin sau khi đã crawl.
Với khối lượng lưu trữ vô hạn, các SE có thể chứa hàng tỉ các kết quả liên
8
quan. Một trang web có thể được lưu trữ nhanh hoặc chậm tùy vào tốc độ
khảo sát, độ tin tưởng của website và nhiều yếu tố khác.
Phân tích_ Analysis: Giai đoạn này SE sẽ làm trên các dữ liệu nó thu
thập được. Sau đó tính độ liên quan của dữ liệu so với yêu cầu người dùng.
Các SE khác nhau có các thuật toán phân tích khác nhau từ đây tạo ra sự
khác biết giữa các SE. Giai đoạn phân tích này sẽ tạo tiền đề cho giai đoạn
phía sau là trả về kết quả
Kết quả_Result: Các kết quả liên quan sẽ được hiển thị trong giai đoạn
này. Các kết quả liên quan hường được sắp xếp phía trên, cao hơn những
kết quả ít liên quan. Mặc dù không phải lúc nào các kết quả cũng thỏa mãn
được yêu cầu của người tìm kiếm. Nhưng cho đến hiện nay, Người dùng
khá hài lòng về những gì SE trả về.
Tuy bức tranh hoạt động của SE bên ngoài nhìn khá đơn giản nhưng
bên trong là tập hợp của rất nhiều thuật toán phức tạp. SE thỏa mãn nhiều
nhu cầu tìm kiếm cho người sử dụng sẽ được sử dụng rộng rãi và phát
triển mạnh mẽ trong tương lai. Ai là vua trọng thị trường tìm kiếm trực
tuyến đầy tài năng này?
3.1.2 Giới thiệu về các search engine thông dụng.
Hiện nay trên thế giới có rất nhiều SE đang hoạt động. Trong đó, phải
kể đến ba chàng khổng lồ đang chi phối 98% thị phần tìm kiếm theo
thống kê của SEO MOD.
9
Hình 3. Bộ máy tìm kiếm
Ngay ở Việt Nam, đa số mọi người đều sử dụng Google để tìm kiếm
thông tin. Vậy nên đề tài của chúng tôi sẽ tìm hiểu trên Google.
3.2 Cấu tạo chung của các bộ máy tìm kiếm.
Bộ máy tìm kiếm thường cấu tạo bởi 3 bộ phận đó là: bộ thu thập thông
tin, bộ lập chỉ mục và bộ tìm kiếm thông tin, được hoạt động theo mô hình
sau:
Hình 4. Cấu tạo chung của bộ máy tìm kiếm
10
3.2.1 Robot_ Bộ thu nhập thông tin
Robot Google được biết đến dưới nhiều tên gọi khác nhau : spider, bot,
crawler, hoặc web worm,…Về bản chất robot chỉ là một chương trình
duyệt và thu thập thông tin từ các website trên mạng, nó tự động duyệt qua
các cấu trúc siêu liên kết và trả về các danh mục kết quả của công cụ tìm
kiếm. Robot thường được ví với hình ảnh con nhện vì nó tự động di
chuyển trên internet thông qua các liên kết và internet chính là mạng nhện
của nó. Hiểu cách thức hoạt động của con nhện này sẽ giúp chúng ta dắt
mũi Google.
3.2.2 Index_Bộ lập chỉ mục
Hệ thống lập chỉ mục trong các công cụ tìm kiếm thực hiện việc phân
tích, chọn lựa và lưu trữ những thông tin cần thiết (thường là các từ khoá
hay cụm từ khoá) một cách nhanh chóng và chính xác từ những dữ liệu mà
Robot thu được. Hệ thống chỉ mục cho biết cách danh mục từ khoá cần tìm
nằm ở trang nào.
3.2.3 Search Engine_Bộ tìm kiếm thông tin
Search Engine hay còn gọi là Web Search Engine là một công cụ tìm
kiếm được thiết kế để tìm kiếm các thông tin trên World Wide Web.
Thông tin này có thể bao gồm những trang web, hình ảnh hay bất cứ một
kiểu file nào trên mạng. Nói rộng ra, Search Engine là hệ thống bao gồm
cả bộ thu thập thông tin và bộ lập chỉ mục. Các bộ này hoạt động liên tục
từ lúc khởi động hệ thống, chúng phụ thuộc lẫn nhau về mặt dữ liệu nhưng
độc lập với nhau về nguyên tắc hoạt động.
Chức năng chính của Search Engine cũng như tên gọi của nó, là công
cụ tìm kiếm thông tin mà thực ra là tìm kiếm các từ khoá trong câu truy
vấn xuất hiện nhiều nhất, ngoại trừ các stop words (là các giới từ hay mạo
11
từ như the, a, an….). Khi gõ một từ khoá (keyword) cần tìm vào một công
cụ tìm kiếm, các Search Engine này có nhiệm vụ tìm các từ khoá đó ở tất
cả các trang Web theo hình thức các trang Web chứa nhiều từ khoá cần tìm
sẽ dễ dàng trả về danh mục kết quả của các Search Engine. Ngày nay, hầu
hết các search engine đều hỗ trợ chức năng tìm cơ bản và nâng cao, tìm từ
đơn, từ ghép, cụm từ, danh từ riêng, hay giới hạn phạm vi tìm kiếm như
trên đề mục, tiêu đề …
Ngoài việc tìm chính xác các từ khoá, các Search Engine phải được
trang bị các phương pháp tìm kiếm đa ngôn ngữ, có nghĩa là nó phải hiểu
được ý nghĩa của từ khoá cần tìm hay thậm chí là sửa cả lỗi chính tả khi
người dùng đánh sai. Ví dụ, khi bạn gõ type vào Google, công cụ tìm kiếm
này sẽ trả về kết quả gồm typing, typist…
3.3 Hệ thống RANK
Alexa Rank là thước đo mức độ phổ biến của các website. Chỉ số thứ hạng
của mỗi website được Alexa kết hợp đánh giá từ 2 yếu tố là: số trang web
người dùng xem (Page Views) và số người truy cập website (Reach).
3.4 Tìm hiểu về SEO
3.4.1 SEO là gì?
SEO là chữ viết tắt của Search Engine Optimization. SEO là một tập hợp
các phương pháp nhằm nâng cao thứ hạng của một website trong các trang kết
quả của các công cụ tìm kiếm và có thể được coi là một tiểu lĩnh vực của tiếp
thị qua công cụ tìm kiếm.
Làm SEO là quá trình tối ưu hóa mã nguồn website, giúp website thân
thiện với các công cụ tìm kiếm để tăng lượng truy cập qua từ khóa tìm kiếm
từ đó tăng số lượng người truy cập tới. Một website được làm SEO tốt, đồng
nghĩa với việc website đó luôn xuất hiện ở thứ hạng cao khi người truy cập sử
12
dụng công cụ tìm kiếm để tìm nội dung mà họ cần. SEO cũng có thể bao gồm
nhiều loại mục tiêu khác nhau khi tìm kiếm như: tìm ảnh, tìm từ khóa, tìm
theo quốc gia và một số loại SEO khác.
3.4.2 Tại sao cần SEO?
Đại đa số lưu lượng truy cập đến với các website hiện nay đều từ các bộ
máy tìm kiếm lớn như : Google, Yahoo, Bing… Nếu website không được tìm
thấy bởi các công cụ tìm kiếm hoặc nội dung không nằm trong cơ sơ dữ liệu
của các bộ máy tìm kiếm thì đó chính là một thảm họa nếu công ty bạn đang
kinh doanh online hoặc có giao dịch trực tuyến hoặc có đi chăng nữa nhưng
kết quả tìm kiếm luôn nằm ở trang 3, 4, 5… trở đi thì cũng coi như là 1 thất
bại.
Làm SEO hiện tại với thị trường phát triển mạnh và liên tục như hiện nay
là điều mà các trang web nên làm và phải làm, hãy bắt đầu ngay vì không bao
giờ SEO là quá muộn.
3.4.3 Từ khóa trong SEO là gì?
Từ khóa trong SEO là một yếu tố quan trọng đối với bất kỳ một công cụ
tìm kiếm nào. Chọn đúng từ khóa để tối ưu là một điều rất cần thiết và đảm
bảo cho sự thành công của bất kỳ một chiến lược SEO nào. Ngược lai, nếu
việc nghiên cứu từ khóa không được tốt vì việc SEO sẽ không chỉ gây tốn
kém về mặt thời gian, mà còn cả tiền bạc và công sức của doanh nghiệp. Có
nhiều cách để thực hiện việc nghiên cứu từ khóa, nhưng quan trọng nhất vẫn
là phải luôn đi sâu, bám sát với dịch vụ – mặt hàng mà website của bạn mang
đến cho người dùng.
Các loại từ khóa: từ khóa ngắn và từ khóa dài
Cách chọn từ khóa SEO: Điều đầu tiên khi chọn từ khóa là bạn phải hiểu
được nội dung của trang web mình đang làm là gì. Bởi vì có như vậy, bạn mới
13
có thể đoán được tâm lý khách hàng và đoán biết được họ sẽ search bằng
keyword nào để vào website của bạn. Thay vì đoán mò, bạn có thể sử dụng
các công cụ nghiên cứu từ khóa. Một trong số chúng là Keyword Planner.
Hãy dùng nó để biết chính xác về những từ khóa mà người dùng hay tìm kiếm
về lĩnh vực mà bạn đang kinh doanh.
3.5 Một số thuật ngữ seo cơ bản
- SEO ?
SEO là từ viết tắt của Search Engine Optimization tạm dịch là tối ưu hóa
website cho việc nâng thứ hạng web trên các cỗ máy tìm kiếm. SEO là một
công cụ marketing online hữu hiệu nhất hiện nay và là nhân tố chính trong
quảng bá website tới mọi người.
- SES ?
SES là viết tắt của Search Engine Submission tạm dịch là Đăng ký website
vào các cỗ máy tìm kiếm. SES được rất nhiều SEOer quan tâm vì đó là cách
nhanh nhất giúp một website mới ra đời có thể được liệt kê trong danh bạ của
các cỗ máy tìm kiếm.
- Keyword ?
Keywords tạm dịch là từ khóa...Là từ chính miêu tả chung nhất về nội
dung mà bạn đang có và là những từ dùng để chỉ sản phẩm, ngành nghề kinh
doanh hay dịch vụ của website...
- Backlink ?
Backlink đơn thuần là một link từ website khác tới website của bạn. Số
lượng backlink là chỉ số về sự quan trọng và sự ảnh hưởng của một trang web
nào đó. Số lượng backlink càng cao thì khả năng được tìm thấy trong các
công cụ tìm kiếm càng cao.
-
Pagerank ?
14
PageRank hay Ranking viết tắt là PR tạm dịch là thứ hạng trang. Đó là
một hệ thống xếp hạng trang Web của các máy tìm kiếm nhằm sắp xếp thứ tự
ưu tiên đường dẫn URL trong trang kết quả tìm kiếm.
PageRank của Google hiển thị trên Google Toolbar là một số nguyên từ 0 cho
đến 10. Đơn vị PageRank có tỷ lệ logarithmic dựa trên khối lượng link trỏ đến
cũng như chất lượng của những trang Web chứ đường link xuất phát này.
Theo Google một cách tóm lược thì PageRank chỉ được đánh giá từ hệ thống
liên kết đường dẫn. Trang của bạn càng nhận nhiều liên kết trỏ đến thì mức độ
quan trọng trang của bạn càng tăng.
- Internet Directory ?
Internet Directory là thư mục trên internet chứa đựng rất nhiều website
theo từng danh mục, từng chủ đề các nhau. Khác với các Cỗ máy tìm kiếm
các thư mục internet không hoạt động tự động mà thường do người quản trị
cập nhật thông tin thông qua bản đăng ký của các chủ website gửi đến. Nếu
website của bạn có mặt tại nhiều thư mục internet thì các chỉ số ranking,
pagerank và cả vị trí trên các search engine cũng cao hơn.
- SEM ?
SEM là viết tắt của Search Engine Marketing. SEM chính là sự tổng hợp
của nhiều phương pháp marketing nhằm mục đích giúp cho website của bạn
đứng ở vị trí như bạn mong muốn trong kết quả tìm kiếm trên internet. SEM
bao gồm các thành phần chính sau:
SEO (Search Engine Optimization)
PPC (Pay Per Click)
PPI (Pay Per Inclusion)
SMO (Social Media Optimazation)
VSM (Video Search Marketing)
15
- SE ?
SE là viết tắt của Search Engine là các cỗ máy tìm kiếm như Google,
Yahoo, MSN - Bing, Ask,… Những cỗ máy tìm kiếm này sử dụng một phần
mềm gọi là Robot, hay Spider, hay Bot hoặc Crawler để tự động index và lập
chỉ mục tất cả các website trên đường chúng đi qua. Sau đó, những thông tin
này được gửi về Data Center của cỗ máy tìm kiếm để xử lý, sàng lọc, phân
loại và đưa vào lưu trữ. Khi một người dùng internet cần tìm một nội dung, họ
sẽ đánh từ khóa và nhiệm vụ của cỗ máy tìm kiếm là lục tìm trên danh bạ của
nó các kết quả liên quan (đã lập chỉ mục trước đó). Công việc này được tiến
hành hoàn toàn tự động và có thứ tự ưu tiên khác nhau cho từng site khác
nhau. Các website tốt, giàu nội dung (như các trang báo điện tử, các blog lớn,
các diễn đàn đông thành viên) sẽ được index thường xuyên hơn.
-
On-page SEO ?
On-page SEO là cách SEO hướng đến nội dung của web bằng việc cải tiến
lại code và nội dung cho trang web, để các search engine sẽ tìm đến website
của bạn dễ dàng hơn. On-page SEO chủ yếu cải tiến HTML tags bao gồm thẻ
Heading (Thẻ Title, thẻ description, các thẻ heading...).
- Off-page SEO ?
Off-page SEO chủ yếu là việc tăng các liên kết đến website của bạn, càng
nhiều liên kết thì càng tốt. Công việc off-page trong SEO cũng khá rộng
nhưng chủ yếu là xây dựng backlink, trustrank...
- Google Penalty ?
Google penalty là một hình phạt mà Google đề ra để áp dụng cho các
website mắc phải lỗi như:
Link tới những site bị banned
Gửi những query tự động lên Google
Hidden text, hidden links
16
Tạo backlink xấu
On-page seo quá dở
- Trustrank ?
Trustrank tạm hiểu là độ tin cậy của Google đặt vào một website, độ nổi
tiếng của website đó, uy tín của website đó. Có thể là do website đã có vài
năm, nhiều website nổi tiếng và link đến website đó, và website đó không sử
dụng bất cứ kĩ thuật spam nào trong quá khứ.
- Sitemap ?
Sitemap hay gọi là Sơ đồ của một website là một danh lục liệt kê tất cả các
mục thông tin trên trang web của bạn cùng sự mô tả ngắn gọn cho các mục
thông tin đó. Sitemap nên được sử dụng dễ dàng trong việc thực hiện tìm
kiếm nhanh để tìm ra thông tin cần thiết cũng như trong việc di chuyển thông
qua các đường link trên website của bạn. Sitemap nên là một sơ đồ hoàn hảo
nhất của website. Sitemap là sự cần thiết cho trang web của bạn để đạt được
một vị trí cao trong các hệ thống tìm kiếm, bởi vì các hệ thống tìm kiếm đánh
giá rất cao cho các trang web có một sơ đồ điều hướng truy cập website.
- SERP ?
SERP là viết tắt của cụm từ Search Engine Results Page tạm dịch là trang
kết quả của công cụ tìm kiếm. Đây là trang Web mà các công cụ tìm kiếm
hiển thị kết quả tìm kiếm ứng với truy vấn từ khóa tìm kiếm của người dùng.
- Anchor text ?
Anchor Text tạm dịch là ký tự liên kết là chuỗi các ký tự ẩn chứa đường
dẫn tới một trang Web hay các tài nguyên khác.
- Google sitelinks ?
Google sitelinks là tập hợp các liên kết xuất hiện phía dưới địa chỉ trang
trong kết quả tìm kiếm. Những đường liên kết phụ này trỏ tới các thành phần
17
chính của trang Web đó. Nó được lựa chọn tự động bởi thuật toán của
Google.
- Outbound Link ?
Outbound Link chính là link ra hay là liên kết trên website của mình đến
những website khác.
- Landing page ?
Là webpage đầu tiên hiển thị cho người dùng khi vào website. Ví dụ nếu
người dùng search từ: "thuê xe đưa đón nhân viên" thì Google sẽ trả về trang
http://dulichphuongdong.vn/dich-vu-thue-xe-dua-don-cong-nhan-vien/
chứ
không phải trang chủ.
- Top 10 ?
Là để chỉ website của bạn có mặt từ 1 đến 10 trong trang đầu tiên của các
trang kết quả trả về từ các bộ máy tìm kếm.
- SMO - Social Media Optimization
Khái niệm SMO (tạm dịch là Tối ưu hóa mạng xã hội) xuất hiện gần một
năm do sự tiến bộ của các mạng xã hội. Theo số liệu Adplanner của Google,
tổng traffic của các mạng xã hội hiện nay vượt xa các nguồn traffic khác và
hiện đứng đầu về lượng traffic trên thế giới. Như vậy, tối ưu hóa mạng xã hội
hay thực hiện tiếp thị lan truyền (Viral marketing) là một công việc quan
trọng. Một website được tích hợp các công cụ SMO sẽ dễ dàng chiếm được
các vị trí quan trọng trong cộng đồng mạng.
- Keyword Stuffing
Keyword Stuffing là thủ thuật liên quan đến các phần trong trang web lặp
lại nhiều lần mộttừ khóa nhất định để gây ảnh hưởng lên kết quả công cụ tìm
kiếm.
18
- Hidden Text
Hidden text là thủ thuật nhằm che giấu văn bản trên trang web khiến cho
công cụ tìm kiếm sẽ nhập vào danh mục nhằm mục đích tăng xếp hạng và
người truy cập sẽ khó phát hiện ra.
Ví dụ: để đoạn văn bản trắng trên nền trắng (sử dụng css cho chữ và nền trùng
màu nhau), để đoạn văn bản cùng màu với ảnh nền cùng màu....
- CRO - Conversion Rate Optimization
CRO (Tạm dịch Tối ưu hóa tỷ lệ chuyển đổi) là tỷ lệ rất quan trọng trong
việc thiết kế website của doanh nghiệp. Trung bình cứ 100 khách hàng đến
thăm website sẽ có một khách hàng tiềm năng. Đối với website, thực hiện tối
hưu hóa sẽ tăng ít nhất 50% khách hàng tiềm năng.
- Click through
Tỷ lệ % số người click vào link website trên trang kế quả tìm kiếm trên
tổng số Impression
- Impressions
Số lần website xuất hiện trên trang kết quả tìm kiếm ứng với mỗi từ khóa.
- Bounce rate
Là tỷ lệ số người click vào website rồi bỏ đi (Không xem tiếp trang tiếp theo).
- Conversion rate
Tỷ lệ số người đặt hàng/ tổng số người duyệt sites.
- Pagerank Sculpting
Pagerank Sculpting tạm dịch là chế tác pagerank là việc mà Webmaster quảng
lý những link liên kết ra ngoài. Liên kết nào phải dùng no-follow để chặn
không cho các máy tìm kiếm nhận biết sự liên quan, liên kết nào phải chú
trọng link sang để tiến hành cho website đó...