Salah satu alasan kenapa halaman web tidak muncul pada SERP adalah duplicate content penalty yang di berikan Google karena Google telah menemukan halaman tersebut telah di copy-paste oleh situs lain. Mungkin juga karena sebuah halaman memiliki lebih dari satu url, dimana Googlebot menganggap bahwa url tersebut menuju ke halaman berbeda-beda, walaupun sebenarnya tidak. Duplicate content juga bisa berarti beberapa situs atau halaman tidak akan terindeks oleh mesin pencari, bahkan bisa aja crawler berhenti mengindeks semua halaman dari sebuah situs karena dia menemukan banyak kopian dari suatu halaman pada url yang berbeda-beda. Terus, apa saja yang dianggap Google sebagai duplicate content?
Menurut beberapa sumber yang saya dapatkan, termasuk blog resmi Google webmaster↓
- Sebuah halaman bisa dianggap duplicate content karena ada situs lain yang menyalin seluruh isi halaman web tanpa menyertakan url sumbernya.
- Sebuah halaman yang memiliki lebih dari satu url seperti canonical URL juga bisa dianggap duplicate content (seperti yang sudah saya sebutkan diatas).
- Situs tersebut merupakan situs afiliasi yang tidak disukai oleh Google, dimana banyak sekali website yang mempromosikan hal yang terkesan sama karena menggunakan semacam template yang ditawarkan program afiliasi untuk digunakan bisnis afiliasi bersama.
- Menggunakan konten yang sama atau yang hampir mirip sekali pada domain/subdomain yang berbeda, misalnya sebuah organisasi yang memiliki banyak domain untuk kepentingan brand-nya, tetapi menggunakan konten yang mirip untuk mempromosikan layanan atau produknya.
- Sebuah situs/blog mengijinkan sindikasi artikel, atau dengan kata lain mengijinkan pihak lain menyalin konten dengan syarat menyertakan link balik, tapi mungkin mesin pencari menyingkirkan artikel originalnya dan malah mengindeks halaman kopiannya. Tapi hal tersebut kurang sesuai dengan yang disampaikan pihak Google di blog Google Webmasters. Matt Cutts sendiri menyarankan untuk menghindari sindikasi konten yang berlebihan daripada mengijinkan sindikasi konten dengan menampilkan tautan aslinya.
- Situs yang memiliki mirror yang sangat banyak. Walaupun memudahkan orang untuk menggunakan konten dari situs alternatif yang sama dengan sumbernya, mesin pencari mungkin mengenali duplicate content pada situs yang bermirror dan mungkin mengabaikan beberapa situs bermirror yang ditemukan.
Apa yang tidak termasuk duplicate content?
Menurut pihak Google, suatu konten yang ditulis ulang dalam bahasa yang berbeda tidak dianggap sebagai duplicate content. Selain itu Google juga menyarankan supaya tidak terlalu khawatir dengan konten yang menampilkan kutipan dari situs lain (seperti quote), karena tidak akan dianggap duplicate content.
Tips untuk menghindari duplicate content ↓
- Tambahkan keterangan hak cipta pada artikel yang kamu tulis atau di bagian bawah website/blog.
- Jika sebuah konten punya lebih dari satu URL, gunakan perintah permanent redirect (301) di file .htaccess, untuk me-redirect pengunjung dan Googlebot ke suatu halaman.
- Jangan biarkan orang lain mencuri hasil kerja kerasmu! Kita tahu kalau menulis konten yang baik itu bukan pekerjaan mudah kan?
- Gunakan macam-macam tool duplicate content seperti CopyScape atau duplicate content tool untuk memeriksa apakah konten kita telah di copas.
- Pahami CMS yang kita gunakan, yang mungkin saja menampilkan konten yang sama dalam format URL yang berbeda.
Kayanya yang terakhir sama deh nasib kita mas. Saya juga meimport semua posting dari blogger. semoga ga kena pinalti
wah kalo blog yg dulunya pake blogspot-an trus dipindah ke custom domain gmn mas..? soalnya link blogspot yg lama sdh trlanjur ngelink di mana2, brarti msh kena jatah indexing oleh google,..waduh bingung aq..
@Putra eka: enakan blogspotnya dihapus sekalian apa gak ya??
@Fachia: Gpp mas, kata mas putra domain blogspot lama langsung redirect ke custom domain
Serem juga ya kalo kena penalti.. ngomong2 bangun donk… jangan bobo mlulu
@Zalukhu: Iya mas tadi saya udah bangun tapi merem lagi soalnya takut lihat muka panda yg serem diatas
@Fachia: di mana mana kok palingkan muka sih pemalu kali ni si neng
okke salamat dah gua padal gua mo tranfer semua postingan di bloger tapi gak jadi aah tar malakene ini lagi
Iya.. saya juga pernah baca itu di blog mereka. Katanya ga perlu takut karena duplicate content asal ngasih linkback ke artikel kita. Kalo menemukan hal itu, silahkan hubungi google katanya..
Kalo saya sih, daripada ga dikasih backlink sama mereka, lebih baik segera kita suntik backlink ke artikel kita itu
Menghargai hasil karya orang lain kuncinya mas, jadi disamping mengurangi copas tadi paling tidak melatih diri untuk belar menulis artikel..Opsss..apalagi speri NB kayak say yg baru belajr blog
@Ronggo: iya tuh si mbak fachia pemalu y..
@ipung: bisa juga sih mas, tp takutnya ntar malah over syndication
@Diah: saya juga newbie yg masih belajar nulis. makasi udah mampir :gembira:
emang fachia cewek ????
walah…komen diatas OOT banget….
back to topic….
copy paste emang gak bisa dihindari, sedikit banyak kita pasti sudah pernah copy paste walaupun itu sekata atau pun sekalimat…..
yang ori dah makin susah…hihihi
@windra: gpp OOT yg penting komen :hebat:
back to topic..
copy paste yg dibolehkan google itu copy paste berupa kutipan atau quote
asal jgn semuanya dikutip
nyari yang baru kok loom ada, tinggalkan jejak aja
untung rewrite bukan termasuk duplicated content
Saya pernah menggunakan feedwordpress untuk mengcopy seluruh rss dari sebuah blog. Jadi setiap blog tsb update, dalam 10detik blog saya juga update. Tidak ada masalah dengan google, semua halaman saya ter index. Tapi…tiba2 di pagi hari yang dingin, ada telp masuk dari seorang bule, dan beliau keberatan dengan apa yang saya lakukan
Say no to duplicate content, say yes to rewrite
Kaburrrr
@@del: iya mbak, klo rewrite gak jadi masalah..
makasi buat infonya
wah..dah lama nggak nengok blog ini…
soal copas… emang susah… dilarang malah dikopas mentah2…
Nggak dilarang apa lagi…
Boleh sih rewrite, tapi lebih afdol kalau dikasih sumber aslinya.
kalau kita “main jujur” insya allah bakal dapat hal baik pula
@kipas: insyaallah mas
Pingback: Muka Baru Fanari-Id.com | Fanari dash Id dot Com | My Official & Commercial Blog
seperti aku harus banyak belajar pada Mas fanari. cuplicate contentku ada 4. di blogspot, wp.com, di domain sendiri, ma calon portalku..gimana ya Mas…
wah saya juga meimport semua posting dari blogger, moga2 nga papa deh..
Kalau konten kita sudah lanjur di duplikasi orang lain pada blognya tanpa menyertakan link sumber, apa yang bisa kita lakukan mas ?
masalahnya suda dua konten saya di kopas orang lain tanpa menyertakan sumbernya
salam kenal dari http://myrazano.com
ditunggu kunjungan dan dukungannya ( maklum blog saya masih sepi )
terimakasih
@oyonk: saran saya sebagai blogger yang pernah menjadi korban copas, hubungi pemilik blog/website yang menyalin konten blog mas dan minta pengertian dan kesediaannya untuk menyertakan link sumbernya. Kalau seandainya tidak berhasil ya apa boleh buat, lagian Google juga bakal tahu kok mana artikel yang asli dan mana yang bajakan, jadi nggak perlu terlalu dikhawatirkan
Pingback: Free SEO Tools from Webconfs | Fanari dash Id dot Com
Baru tahu aku … katrok bener … tapi …. mau komentar lagi kehabisan ide
canonical url tu ap yah?????
@mbah gendeng: URL yang mempunyai variabel, misal
http://www.facebook.com/home.php?ref=profileisinya sama denganhttp://www.facebook.com/home.phpohhh gitu yah….. btw mas pertanyaanq yang pertama di jawab yah gimana seo tentaang ganti link yang udah ke index…… untung ruginya gimana
Hem..kebetulan blog saya kena pinallti neh..tiba2 semua yang ke index google hilang semua. ada tips..?
Thanks. pertanyaannya. apa yang harus dilakukan kalau blog sudah kena google pinalty (index di google hilang)