Обхождане в мрежата

Уеб мрежата е като библиотека, която разполага с безброй много книги. Именно поради тази причина Гугъл разработва и създава софтуер, който преглежда всички сайтове, отваря връзките вътре в тях и открива тези, които счита за най-подходящи, показвайки ги на предни позиции в класирането. Ботовете обхождат сайтовете и дават обратна връзка за тях в сървърите на платформата

Ботовете съответно непрекъснато обхождат мрежата и обновяват индекса, откривайки страници и информация.

Когато ботовете открият страница, те обръщат внимание на някои основни и важни сигнали: ключови думи, актуалност на уебсайта и др., които се следят в индекса на търсене.

Този индекс е с размер над 100 000 000 гигабайта и съдържа стотици милиарди уеб страници. В него е записана всяка дума, която е срещната при индексирането на всяка отделна страница.

Колкото по-голям и по-популярен е сайтът, толкова по-често ботовете го посещават, за да отразят новата информация. 

Уеб администраторите могат да поискат от Google ботовете да не обхождат съответния сайт или да пуснат молба той да бъде повторно обходен, ако считат, че е допусната някаква грешка. 

Визията на платформата обаче представя концепцията, че тя предоставя едни и същи условия и инструменти за всички уеб сайтове, за да може да се гарантират възможно най-добрите резултатите за потребителите.

Така, че в крайна сметка трябва да знаете, че изпълнението на повторно обхождане не е гарантирано и решението остава на Гугъл. 

Абсолютно нормално е Гугъл да иска да показва резултати с данни, които носят стойност на потребителя, имат точен смисъл и значение в посока разбиране и отговаряне нуждите и желанията, ограничавайки спама. 

В морето от данни и информация, процесът на тяхната организация, структуриране и семантично свързване е основна роля на търсачката. 

Семантичното търсене помага на Google да идентифицира и дискредитира съдържание с ниско качество. Методите като използване на прекалено много ключови думи, подвеждащи заглавия и др. са много по-лесни за откриване и маркиране, благодарение на латентно семантично индексиране (LSI), латентно разпределение на Dirichlet (LDA) и схеми за претегляне на честотна обратна честота на документа (TF-IDF), които използват термин честота и техните предварително определени претеглени отношения за определяне на качеството. Това означава, че търсачките имат добра представа какви думи статистически се срещат заедно и правят семантични корелации, които могат да се използват във войната срещу спама.

Прочетете още: Алгоритъм на Гугъл – въведение

Складиране на информацията

Google е сред най-големите технологични компании в света, която разполага с огромна база данни, където съхранява текстово съдържание, снимки, видеоклипове, контакти, местоположения, документи, история на търсенията, история на изтеглянията и много други. 

Google има множество центрове за данни, разположени по целия свят, като най-малко  12 от тях се намират на територията на Съединените щати. Най-големите известни центрове са позиционирани в Далас, Орегон; Атланта, Джорджия; Рестън, Вирджиния; Леноар, Северна и Южна Каролина.

Файловата система на Google (Google File System или GoogleFS) е разработена от платформата за осигуряване на ефективен и надежден достъп до всички данни с помощта на големи клъстери от хардуери. 

Google File System е предназначена за взаимодействие между система, а не за взаимодействие между потребител и система. Чан сървърите копират данните автоматично.

Google File System е създадена и непрекъснато се подобрява за основните нужди на Google за съхранение и използване на данни (предимно в търсачката). Възможността за генерирането на огромни количества данни съответно е свързано и с тяхното запазване. 

Файловете са разделени на по 64 мегабайтови клъстери, с файлове, които обикновено се добавят или четат. Системата е проектирана и оптимизирана да работи така, че да се избегнат загуби на данни. Други решения се спират на висока пропускателна способност на данните, дори когато това става с цената на закъснение.

Главният сървър съхранява всички метаданни, които периодично се актуализират и по този начин се предоставя потребителско пространство тип “библиотека”.

Избирайки от резултатите съобразно сравнителния анализ, файловата система постига ефективност на четене.

Page Rank

Google използва алгоритъм, наречен PageRank, който дава оценка за приложимост на всяка страница. Основният показател за неговото определяне е поведението на потребителите

PageRank зависи от няколко фактора:

  • Честотата и местоположението на ключовите думи в уеб страницата: ако ключовата дума e включена само веднъж на страницата, то тя ще получи ниска оценка по съответната ключова дума, а ако се повтаря прекалено много пъти, ще бъде отчетена като спам.
  • Големината на сайта, броя на предлаганите продукти и услуги, допълнителни възможности за пазаруване, които се осигуряват.
  • Наличието на блог.
  • Възрастта на уеб страницата –  всеки ден се създават нови страници, но не всички се задържат дълго. Google дава повече стойност на страници с установена история и постоянно актуализирано съдържание.
  • Броят на връзки от други уеб страници – Google разглежда колко уеб страници се свързват с даден сайт, за да определят неговата уместност.
  • Спазени ли са протоколите за сигурност.
  • Отзивите от потребителите.

Какво да направите, за да подобрите своя Page Rank?

  • Уверете се, че Вашия сайт е функционален и лесен за използване от страна на потребителя.
  • Изключително важно е да приспособите дизайна на сайта еднакво добре за десктоп и за мобилни устройства.
  • Дайте колкото се може повече изчерпателна информация за себе си, за дейността си, за своята мисия, продукти и т.н.
  • Направете блог към основния сайт.
  • Направете карта на сайта (Sitemap) на сайта, която ще помогне на бота да го обходи бързо и лесно.
  • Ако бизнесът Ви изисква работа с лични данни, приложете съответните мерки за сигурност и задължително включете Общ регламент за защита на личните данни (GDPR)
  • Създавайте уникално, полезно и актуално съдържание, съобразено със спецификите на всяка отделна платформа.
  • Идентифицирайте дигиталните платформи, които в най-пълна степен ще Ви помогнат да популяризирате своя бизнес или бранд.
  • Създайте цялостна концепция за публикуване и споделяне в социалните мрежи, която да обвържете с бранда и сайта.
  • Обвържете бранда също така със своя персонал, екип, служители и партньори.
  • Създайте си профил в Google My Business.

Прочетете още: Google My Business – ръководство с първи стъпки за използване

Подобряване на търсенето

Когато въведете заявката си за търсене, Google идентифицира и анализира думите, които са използвани. Търсачката разполага с инструменти, които й позволяват да разбере написаното, независимо на какъв език е то, да генерира система от синоними,  да отчете наличието на правописна грешка например и да я коригира.  

По този начин Google категоризира търсенето Ви и чрез своя индекс Ви предлага най-подходящите страници.

Корекцията на правописа е част от нещата, които допълнително подчертават успеха на Гугъл в прилагане на инструменти и приложения за представянето на висококачествени резултати. В случай, че все пак потребителят иска да види резултатите от точно написаната от него дума, Google дава и тази опция.

Поради броя на страниците, които се създават и качват в интернет непрекъснато, възможно е да забележите промени в резултатите от търсенето си за кратък период от време. Това е така, защото Google добавя новото съдържание към индексирането си. Актуалните новини и събития например бързо се извеждат на предни позиции, но не се задържат там дълго време. 

Развитието на Гугъл стига до там, че може да бъде зададен въпрос в търсачката, след което се визуализират допълнителни въпроси, селектирани по показателите уместност и полезност спрямо конкретното търсене.

Увеличаването на активността в мрежата и навлизането на интелигентни лични асистенти, като Google Home, със сигурност сочат, че най-голямата търсачка в света ще продължи да се развива.

Любопитно: Google Home е интелигентно устройство-асистент, което се управлява с гласови команди и може да: отговаря на въпроси, чете на глас, пуска музика и видео, разказва истории, задава час за аларма, включва и изключва осветлението, извършва обаждания по телефона и др. На настоящия етап, продуктът не се предлага в България.

Семантично търсене в Google

Семантичната мрежа (Semantic web) е концепция, свързана с развитието на World Wide Web (световната информационна мрежа) и интернет мрежата. 

Като част от нея, семантичното търсене представлява сложен и комлексен процес, който има за цел да намира информация и съдържание спрямо конкретна заявка за търсене от страна на потребителя. Това е методология, която не просто открива съответствие по зададените ключови думи, но също така определя насочеността и контекстното значение на думите, които човек използва, за да може да му предложи възможно най-приложимите и значими за него резултати. Те се извеждат чрез предварителна оценка и разбиране на ключовите думи или фрази за търсене в мрежата в комбинация със специално разработени алгоритми. 

Концепцията за семантичното търсене се основана на принципите на езиковата семантика. За разлика от типичните алгоритми за търсене, то взима предвид същността на думите, контекста, в който са използвани, формулираната концепция, реалните намерения и др.

Семантичното търсене включва също така местоположение, тълковно значение на думите, синоними, текущи тенденции, вариации на думи и други елементи на “естествения” език като част от параметри за търсенето. 

Формулировките за семантично търсене се извличат от различни алгоритми за търсене и методологии, включително картографиране по ключова дума, графични модели и логика.

Семантичното търсене се стреми да подобри точността на търсенето, като разбере намерението на търсещия чрез контекстуално значение, осигурявайки повече интерактивни резултати от търсенето чрез трансформиране на всички данни в интуитивна и отзивчива база данни. 

Семантичното търсене води до по-добро и цялостно разбиране на желанията и намеренията на търсещите, чрез повишаване способността за извличане на ефективни отговори, които да предоставят по-персонализирани резултати. 

То е свързано с генерирането на възможно най-точните резултати спрямо желанията на потребителя според търсещата машина. Както вече отбелязахме, това става чрез разбиране на:

  • Намерението на търсещия.
  • Контекста на заявката.
  • Връзките между думите.

Семантичното търсене има за цел да  да разбере естествения език по начина, по който човек би го направил. То позволява на Google да прави разлика между различни субекти (хора, места и обекти) и да интерпретира намерението на търсещия въз основа на различни фактори, включително:

  • История на досегашните търсения.
  • Местоположение на потребителя.
  • История на глобалното търсене.
  • Варианти на правописа.

Любопитно: Понятието „семантика“ се отнася до изучаването на думите – тяхната същност, значение и логика. Респективно, от него произлиза и прилагателното “семантичен” в различните си форми.

Графиката на Google Knowledge Graph

Google обработва трилиони търсения всяка година, а 15% от всички заявки са нови. Това е огромно количество информация, поради което платформата търси и намира начини да представя данни, които да удовлетворяват потребителите. 

Именно в тази насока е създадена и Графиката на знанието (полето за информация, което след съответното търсене в Google се визуализира в дясната горна част на десктоп и в най-горната лента на мобилни устройства, наричано още инфо бокс).

Графиката на знанието представлява огромна база данни с информация за абсолютно всичко: хора, събития, видеа, дати, места и др., която има за цел да отговори на запитванията и да насърчи потребителите да откриват повече възможности чрез предлаганите свързани теми, линкове и препратки.

Google Knowledge Graph показва информацията по два начина – в секция в горната дясна част на екрана или като въртележка, която се показва в горната част на страницата с резултати. Графиката предоставя кратка, конкретна и точна информация, свързана с тази, която потребителят търси в Google.

Google Knowledge Graph е стъпка към усъвършенстването на платформата в стремежа й да разбере повече за човека, неговото мислене, интереси и поведение, за да може да предложи резултати отвъд това, което съответства единствено по съдържание на ключовите думи. 

Това дава лесен достъп до различна информация, която е концептуално съобразена с нашите търсения. 

Google Knowledge Graph подобрява резултатите от търсенето, както и своите услуги, предлагайки резултатите, генерирани от различни източници.

За да се получат най-важните резултати от търсенето, графиката на знанието разглежда семантичното търсене. Това включва контекста на научните изследвания, синоними, местоположението на търсещия и различни други точки.

Няма представена официална документация за технологията, използвана за прилагането на графиката на знанието.

Информацията се представя на потребителите в инфобокс или така наречения “панел от знания” до резултатите от търсенето. Обхванатата от графиката на знанието информация покрива над 570 милиона предприятия и 70 милиарда факти, отговаряйки на приблизително една трета от над 100-милиарда месечни търсения, обработвани от Google. 

Графиката на знанието е критикувана за предоставяне на отговори без да налага влизането в оригиналния източник.

Финални думи

Организацията на данните е стигнала толкова високо ниво, че Google може да ни предложи редица възможности, сред които винаги избира възможно най-полезните и еквивалентни на нашето търсене. Имаме достъп до различни приложения, карти, библиотеки, обществени институции и общо взето всичко, което можете да се сетите, а даже и отвъд него. Няма нещо, което не можете да намерите в Гугъл. Остава важният въпрос: Как да намерят Вас в Гугъл?

Обадете ни се и ние ще Ви дадем нужните отговори: 0879 869 944 

e-mail: office@webtitan.bg