Back to Question Center
0

Սեմալը էջի հատվածները եզակի է եւ անտեսում է կրկնօրինակ բովանդակությունը:

1 answers:

Երբ էջը բովանդակություն է պարունակում, որը նաեւ կայքում այլ էջերում է, այլեւ որոշ յուրահատուկ բովանդակություն, ինչպես է Google- ը կարգավորել այն: Արդյոք Google- ը

  • ամբողջ էջի համառոտագիրը (ներառյալ կրկնօրինակների բովանդակությունը)
  • Index- ի եզակի տեքստը էջում
  • էջի էջերից ոչ մեկը (նույնիսկ եզակի բովանդակությունը)

Հստակեցման համար ես խոսում եմ միայն կայքի մեջ կրկնվող բովանդակության մասին, այլ կայքերից պատճենված բովանդակություն.

Ես հարցնում եմ, քանի որ ես պատասխանել եմ մի քանի հարցի `ենթադրելով, որ Google- ը կներկայացնի յուրահատուկ բովանդակություն, նույնիսկ եթե այն նույն էջում կրկնօրինակ բովանդակություն ունի. Semalt, ես հասկացա, որ ես որեւէ ապացույց չունեմ, որ դա իրականում ճշմարիտ է.

Սա կրկնօրինակ բովանդակության սցենար է, որը չի բխում մեր կրկնօրինակ բովանդակության բոլոր հարցի վրա. Ինչ է կրկնօրինակ բովանդակությունը եւ ինչպես կարող եմ խուսափել իմ կայքի համար պատժամիջոցներից:

- biomass boilers residential
February 6, 2018

Պարզապես այցելած յուրաքանչյուր կայքէջը առնվազն կունենա կրկնօրինակ բովանդակության որոշակի տոկոս. Դրա կատարյալ օրինակն այն կայք է, որը հատուկ է կայքի բոլոր բովանդակության էջերում, նշելով, որ բովանդակությունը կայքէջի մաս է կազմում. Նման բան այն է, ինչ Google- ը կներդնի իր ամբողջությամբ (իհարկե, մնացած բովանդակության բնույթը, բնօրինակը եւ յուրահատուկ է կայքի համար, այլ ոչ թե պատճենահանված այլ բառերից). Heck, եթե google- ը չի ցուցաբերել այս մասին, ապա հազարավոր լեգիտիվ առցանց ընկերություններ կստեղծեն զանգվածային բողոքներ, իրենց կայքում չհրապարակված լինելու մասին.

Եթե մյուս կողմից դուք ունեք էջեր, որոնք հիմնականում բաղկացած են կրկնօրինակ բովանդակությունից, որտեղ յուրաքանչյուր էջի տարբերությունը տեքստի մի քանի բառից պակաս է, ապա google- ը կարող է շատ լավ վերաբերվել այն որպես կրկնօրինակ բովանդակություն եւ որոշի, թե որն է կրկնօրինակներից մեկը էջերը, եթե առկա են.

Այն, ինչ ես առաջարկում եմ, փորձել է կրկնօրինակ մակարդակը երկու էջերի միջեւ դարձնել ավելի քիչ, քան 60% (իդեալական), կամ առնվազն 80%.

Օգտագործելով այնպիսի գործիքներ, ինչպիսիք են այստեղ գտնվածը. http: // www. webconfs. com / similar-page-checker- ը. php կարող է ձեզ գաղափար տալ, թե ինչպես են նման երկու էջերը. Այս գործիքի հետ երբեք ոչ մի նպատակ չի հետապնդում.

Կարծում եմ, Google- ը որոշում է ինդեքսավորման մասին URL- ի կրկնօրինակի (կամ նմանության) չափը չափել URL- ի հիման վրա եւ ցուցանիշները կազմում են ավելի քիչ, քան 100% (կամ 90% կամ X% - միայն Google- ը գիտի հենց այդ թիվը ) կրկնօրինակ (եթե ոչ, ոչ noindex , կանխում է այն).

Կրկնօրինակված բովանդակություն գտնելը չնչին խնդիր չէ, եւ սխալ է հակված էջի քրոմի պատճառով. Ահա թե ինչու ես կարծում եմ, որ Google- ը շատ էջեր կներկայացնի բոլոր էջերի վրա եւ միայն կասկածաբար կրկնվող էջեր է բացում.

Հետաքրքիրն այն է, որ ներքին կրկնօրինակված որոշակի պարունակություն ունեցող էջերը (կրկին պահանջը `ավելի քիչ, քան 100%) կարող է ոչնչացնել իրենց ներքին մրցակիցների աղյուսակը:.

Լավ. Ես կփորձեմ եւ բացատրել այն, ինչ գիտեմ լավագույնը, որ կարող եմ արագ. Գուցե պարզապես պարզաբանելու որոշ բաներ կբացահայտեն.

Google- ի վաղ օրերին տերմինի ինդեքսը, ըստ էության, կապող կամ տերեւային աղյուսակ է, որը տերմինի ինդեքսում (առաջ եւ հակադարձ) պայմաններ է կապել docID- ի եւ wordID- ի այլ չափանիշների հետ. Սեմիստիկ ավանդույթի մի մասն է դիտել տերմինի (բառի) դիրքորոշումը փաստաթղթի վերաբերյալ կետերի վերաբերյալ. Google- ը, ուսումնասիրելիս, միայն պահպանել է մեկ դիրքորոշման մետր, հիմնված փաստաթղթի սկիզբը

բայթերում. Դա, իհարկե, ընդգրկված չէ HTML ձեւաչափով, բայց վաղ օրերին ներառված են HTML header, footer, sidebar բովանդակություն եւ այլն.

Այսպիսով, Google- ը կկարողանա որոնել միմյանց հետ փոխհարաբերությունների պայմանները. Սա նշանակում է, որ մինչդեռ փաստաթուղթը ամբողջությամբ չկրկնված չէ, բավականաչափ հեշտ էր որոշել, որ փաստաթուղթը կրկնօրինակ էր մաթեմատիկական ուղեցույցների որոշակի սահմաններում `այն տոկոսը, հարաբերակցությունը կամ ինչ.

Այս մեթոդի հետ կապված խնդիրը այն է, որ փաստաթուղթ վերադասավորելը կամ մանողը օգտագործելը կարող է հեշտությամբ հաղթել.

Հաշվի առնելով, որ սեմիստիկան ավելի շատ ներգրավված է, քան մեկ կետից ժամանակակից հարաբերությունները եւ նմանատիպ պայմանները, բազմակի ժամկետները եւ այլն. , Կրկնօրինակման բովանդակությունը ավելի հեշտ էր գտնվել, չնայած դեռեւս լիարժեք չի ավարտվել, եթե համեմատվում է համեմատաբար գծային համեմատական ​​մոդելում.

Մուտքագրեք DOM- ը.

Օգտագործելով HTML DOM մոդելը, կրկնվող բովանդակության բաժինները կարող են ավելի հեշտությամբ համեմատվել վերլուծական բաժինների հետ, ինչպիսիք են վերնագրերը, ստորագրությունները, sidebars եւ այլն:. Սա է տրվում այս օրերին, քանի որ այն երկար ժամանակ է եղել գերազանց արդյունքներով. Բովանդակությունը այժմ էջի բովանդակություն է, որը մարդիկ կճանաչեն. Այս ձեւանմուշային բովանդակության բաժինները, իհարկե, ինդեքսավորված են (հիմնվելով Google- ի թերության վրա, որը փաստում է այս փաստը նույնիսկ 2015 թվականին), սակայն հիմնականում անտեսվում է որոնման խաղերի համար.

Լավ, մենք դա հասկանում ենք. Բայց ինչ վերաբերում է իրական բովանդակությանը:

HTML DOM մոդելը դեռեւս օգտագործվում է. Յուրաքանչյուր բովանդակության համար DOM տարրը, հիմնականում վերնագրի տառերը, պարբերությունները, սեղանները եւ այլն. , յուրաքանչյուրը semantically weighted օգտագործելով մի շարք semantic ալգորիթմների որոշ եզակի եւ ոմանք միասին ստեղծել մաթեմատիկա, որը դուք կարող եք մտածել աղյուսակի / սեղան սորտերի. Այս ամենը թվարկում է ալգորիթմի կշիռներով. Քանի որ իմաստաբանությունը տերմինների անմիջական համեմատություն չէ, նշանակում է, որ մեքենան, մեքենան, մեքենան եւ այլն. , միեւնույնն է, այս պայմանների բազմակի տարբերակների հետ եւ այլն. , ցանկացած ալգորիթմը հեշտությամբ կարող է գտնել բովանդակություն, որը վերածվել է, վերակազմավորվել եւ այլն. Բանալին այն է, որ մատրիցան կարող է ընդգրկել տարբեր բովանդակության չափսերը, մի քանի matrices- ի համընկնում է մատրիցիայի մատրիցով.

Մաթրիքսը կներկայացնի բովանդակության հատվածներ (ինչպես սահմանված է սեմինտիկայում). Սա, HTML- ի համար, կլինի վերնագիր տեքստ, այն հաջորդ պարբերություններից հետո, որոնք ավարտվում են հաջորդ վերնագրում, ինչպես նաեւ որպես եզակի պարբերություններ եւ որպես խումբ. Բովանդակության հատվածը կարող է նաեւ եզակի նախադասություն լինել, բայց մենք մի փոքր կդառնանք դրա մեջ. Օգտագործման ժամկետի դիրքը վերնագրի սկզբից, պարբերության սկիզբը, վերնագրերի խմբերի խմբի սկիզբը եւ այլն:. , ժամկետային հարաբերությունների բնօրինակը կարող է օգտագործվել. Բայց առավել եւս կարեւոր է, որ մաթեմատիկայում ներդաշնակությունը կարելի է տեսնել շատ հեշտությամբ. Այն չի ընդունում հրթիռային գիտնական, ճանաչելու դրանք. Սեմական գնահատականները կրկնօրինակում են.

Իմանալով, որ բովանդակության հատվածը նույնպես փոքր է որպես եզակի նախադասություն, նոր բան կա. Բովանդակության հատվածները նույնպես դիտարկվում են նոր ձեւերով ճանաչելու բովանդակությունը, որը ստեղծվում է ծրագրավորող լեզվով փոփոխականների միջոցով. Սա դեռ բավական հեշտ է հայտնաբերել, չնայած որ հենց հիմա, ես դեռ որոշում եմ այդ մասին. Այն դեռեւս հիմնված է սեմինտիկայի վրա, սակայն, թե ինչպես է դա փոխվում, կարող է նշանակել միայն ավելի զգայուն սեմական վերլուծություն. Եղեք այնպես, ինչպես դա կարող է, վերնագրի պիտակները, պարբերությունները եւ նախադասությունները վերլուծվում են 2015 թ.-ից ավտոմատացված բովանդակության ստեղծման համար, որը կարող է այլ կերպ խուսափել այլ կրկնօրինակ բովանդակության վերլուծությունից:. Այս վերլուծության արդյունքն այն վայրերն են, որոնք մենք խոսում ենք.

Լավ. Վերադառնալին, թե որն է կրկնօրինակումը.

Առաջին բանը հիշելն այն է, որ Google- ը վերբեռնում է էջը, ամբողջ HTML կոդը պահպանվում է հղման համար. Սա օգտագործվում է էջի քեշը կառուցելու համար, բայց իսկապես օգտագործվում է, որպեսզի Google- ը վերադառնա եւ կիրառի նոր կամ թարմացված վերլուծություն բովանդակության համար առանց վերբեռնել էջը.

Ակնհայտ է, որ HTML- ի շտեմարանային բովանդակությունը ամբողջությամբ անտեսվում է, երբ որոնման հարցումը կատարվում է, չնայած կան որոշ չափազանց աննշան բացառություններ, որոնք, կարծես, անցել են Google- ից մինչեւ վերջերս. Դուք կգտնեք, որ այն չափազանց հազվադեպ է, որ Goog