Популярні Пости

Вибір Редакції - 2024

Разработчіца Google про те, що і як люди шукають в інтернеті

Кожен день ми шукаємо відповіді на питання про те, як стати щасливими, або чому вода під кригою не замерзає. Не останню роль у формуванні нашого підходу до даних зіграли пошукові системи, в тому числі Google, який в Росії вже вісім років. Wonderzine поговорив з разработчіцей Ганною Кондратьєвої, яка зараз працює в підрозділі пошуку в московському офісі Google. Вона розповіла, як за декаду змінилася мова, якою ми розмовляємо з пошуковими системами, чому не варто боятися контекстної реклами і чому голосовим пошуком люди користуються тільки на самоті.

З МОМЕНТУ, ЯК GOOGLE ПРИЙШОВ ДО РОСІЇ, ПРОЙШЛО ВІСІМ РОКІВ. ВИ НАПЕВНЕ, ЯК І ВСІ ПОШУКОВІ СИСТЕМИ, індексуєте ЗМІСТ ІНТЕРНЕТУ. І У ВАС НАПЕВНЕ Є ЯКІСЬ ДАНІ, ЯК ЗМІНИЛИСЬ ЗАПИТИ З МОМЕНТУ ПРИХОДА GOOGLE І В НАШ ЧАС. ЩО ЗАРАЗ ШУКАЮТЬ НАЙБІЛЬШЕ?

В першу чергу змінилися не тільки пошукові запити - змінилися пошукові системи, і досить сильно. Ці зміни завжди взаємопов'язані: якісь функції з'являються в пошуковій системі, люди розуміють, що вони там є, і починають цим користуватися. Іноді зміни приходять з іншого боку, тобто за запитом користувача. Ця система еволюціонує постійно. На зорі розвитку пошукових систем все було влаштовано дуже просто: ви вводили слова, які хотіли побачити, і вам знаходили документи, які містять ці слова. Зараз пошукові системи набагато складніше: у нас є карти, у нас є відео, у нас є безпосередні відповіді на питання. Ми намагаємося розуміти, про що саме запитав користувач.

В кінці 2012 року Google запустив в Росії принципово новий сервіс - "Knowledge Graph", по-російськи він називається "Мережа знань". Це база даних, але не індекс ключових слів і адрес, а набір статей, пов'язаних між собою семантичними посиланнями, граф фактів і зв'язків між ними. Завдяки такій структурі Google не просто намагається знайти інформацію, дослівно відповідну запиту, а здатний прямо відповісти на питання користувача. Якщо, наприклад, користувач запитує про якогось актора, ми намагаємося видати максимум інформації про це актора відразу - розповісти, чим він знаменитий, яке його сімейний стан, які його фільми найбільш популярні, з якими акторами він знімався. Тобто це набагато складніша система, ніж просте відповідність одних слів іншими словами.

І користувачі, в свою чергу, починають спілкуватися з пошуковою системою вільніше - вони починають задавати питання, як якщо б вони запитували свого друга, який дуже багато знає. Вони не говорять як раніше ...

Ковбаси.

Купити ковбасу - це теж дуже складний запит! Коли ви говорите "купити ковбасу" система повинна зрозуміти, що "ковбаса" - це продукт, і що, кажучи "купити", ви маєте на увазі якусь дію і, швидше за все, хочете побачити який-небудь магазин. Навряд чи ви хочете купити ковбасу в інтернеті, швидше за все, ви хочете знати, де поблизу є продуктовий магазин, який відкритий прямо зараз. Тобто це зовсім не так просто, як могло б здатися.

ТОБТО ВИ підлаштовуватися під ЗАПИТИ КОРИСТУВАЧА АБО ВСЕ ВІДБУВАЄТЬСЯ НАВПАКИ? До ПРИКЛАД, ЯКЩО Я ХОЧУ ПОБАЧИТИ, ЯК ВИГЛЯДАЄ ДОЧКА Райан Гослінг І ЕВИ МЕНДЕС, МЕНІ ДОСИТЬ ВВЕСТИ ЇХ ІМЕНА в пошукових системах.

Вірно, і якщо ви введете їх, то в випадають підказках побачите, що цим цікавиться величезна кількість людей.

А РАНІШЕ, НА ЗОРІ РОЗВИТКУ пошуковик АБО, НАПРИКЛАД, ПІД ЧАС ІСНУВАННЯ "Рамблер" І ЙОГО БУТТЯ ВСЕ ЩЕ ПОШУКОВОЇ СИСТЕМОЮ, МЕНІ вимагав би ВВЕСТИ ПОВНІСТЮ ВЕСЬ МІЙ ЗАПИТ: Райан Гослінг, ЕВА МЕНДЕС, 15 ВЕРЕСНЯ, ВЕЧІР, США, ДОЧКА.

І з величезною ймовірністю раніше ви б побачили виключно сторінку Вікіпедії, а не новина про народження дитини. Хоча її тоді не було, так що це був би який-небудь IMDB. Тобто зараз ми підлаштовуємось під користувачів, намагаємося все більше і більше розуміти їх наміри. Не просто видавати найпростіші відповідності, а розуміти, що саме людина хоче побачити, і вирішувати проблеми, які у нього виникають. Одночасно зворотний процес теж вірний. Якщо люди розуміють, що у нас є карти і на цих картах можна пошукати все кафе в окрузі, вони починають це робити частіше. Це ситуація, коли попит і пропозиція знаходять один одного.

Є жарт про те, що можна залізти на YouTube, щоб подивитися, як варити борщ, а через півгодини виявитися у всесвіті Стівена Хокінга

Зараз в медіасередовищі поширений такий тренд, як explanatory journalism. Фактично журналісти забирають у Google його функцію. Якщо ти зараз хочеш розібратися в якійсь складній ситуації, досить прочитати одну статтю, а не ставити 150 запитів в Google. Ви не боїтеся, що через цю тенденції з часом пошуковики перетворяться просто в збірник побутових знань? Тобто через десять років люди будуть приходити в Google тільки потім, щоб щось купити і знайти щось конкретне.

Будь-яка система, яка знаходить відповідь на питання, в тій чи іншій мірі є пошуковою системою. Протилежної є ситуація, коли у вас немає питання, а вам пропонують інформацію, вважаючи, що вона може бути вам цікава. Наприклад, журнал сам дає нам знання, ми не ініціюємо цей процес. Журналіст пропонує інформацію, не знаючи, потрібна вона людині чи ні. Пошук влаштований навпаки - там користувач є активною стороною, він починає ініціювати цей процес своїм запитом. Це дуже персональна і дуже багатофункціональна система. Тому що навіть у однієї людини спектр запитів величезний протягом невеликої кількості часу.

Є жарт про те, що можна залізти на YouTube, щоб подивитися, як варити борщ, а через півгодини виявитися у всесвіті Стівена Хокінга і дивитися відео про те, як влаштовані чорні діри. У кожної людини набір речей, який йому цікавий, просто величезний - як у цілого народу і всього людства. Відповідно, журналістика, яка пропонує інформацію для певної групи користувачів, не може повністю задовольнити інтереси людей з інших груп. Пошуковий запит видає миттєву інформацію на те, що цікавить вас прямо зараз, в цю секунду.

Ми вже відвикли і не пам'ятаємо, як це було, коли пошукової системи і інтернету не було. Ми не пам'ятаємо цього моменту: коли ми хотіли дізнатися, хто був дружиною якогось відомого людини або історичного персонажа, то треба було йти в бібліотеку, шукати цю книжку - це був дуже складний і дуже довгий процес. Зараз ми робимо це настільки швидко, що навіть не замислюємося про те, яка технологія за цим стоїть. Настільки це стало буденно, що ми не розуміємо, наскільки це насправді важливо, наскільки доповнює наш світ, наскільки прискорює наші можливості до навчання і отримання інформації.

Скільки в середньому раз в день звертається людина в Google?

Google в середньому обробляє 40 тисяч запитів в секунду. Ми, звичайно, не можемо сказати, скільки разів та чи інша людина звертається до Google.

чи відрізняються чимось чоловічі і жіночі запити в Google?

Якщо подивитися уважно, особливо на кілька запитів поспіль, то, напевно, можна припустити, чиї це були запити. Якщо запитують, як готувати пиріг, то, швидше за все, це все-таки жінка, а якщо запитують, як варити сосиски, то, найімовірніше, чоловік. Але це, звичайно, дуже поверхнева оцінка, насправді ми не знаємо, хто стоїть за тим чи іншим запитом. Ми дуже акуратно ставимося до особистих даних користувача. Наприклад, ні я, ні один з інженерів не може дізнатися, який чоловік що шукав, - це абсолютно неможливо.

Нещодавно була серія статей, що Google знає про вас те, що ви самі про себе не знаєте. Чесно кажучи, у мене в самої створюється таке враження іноді. Коли ви аналізуєте мої пошукові запити, а потім на підставі цього видаєте мені контекстну рекламу, я думаю: блін, Великий брат стежить за мною.

Коли користувачі надають нам дані, наприклад, реєструючи обліковий запис Google, ми використовуємо їх, щоб поліпшити роботу сервісів і зробити їх ще зручніше. Завдяки цим даним ми показуємо вам більш релевантні результати пошуку та рекламу і забезпечуємо можливість легко ділитися інформацією. При цьому ми завжди дбаємо про те, щоб користувачі розуміли, як використовуються дані, а також яким чином можна захистити свою конфіденційність. Зокрема, кожен користувач може управляти певними типами відомостей в обліковий запис Google за допомогою "Особистого кабінету", налаштовувати зовнішній вигляд свого профілю Google за допомогою редактора, управляти доступом інших осіб до даних і так далі.

Реклама - це зовсім окрема система, яка працює без втручання людей. Тобто всю інформацію, яку вона обробляє, вона нікому не показує. Тому ми, як інженери пошуку, не маємо ніякого доступу до цих даних. Все, що відбувається у Вегасі, залишається у Вегасі. Відповідно, все, що відбувається в рекламі, залишається виключно в рекламі. Не існує способу, який би дозволяв хоч якусь інформацію звідти витягти. Реклама може здогадуватися, що ви жінка. Але ніхто ніяким чином цю інформацію використовувати не може. Це принципова позиція компанії, тому що це погано для нас і погано для користувачів. Крім того, користувач може змінювати налаштування своїх рекламних переваг, в тому числі категорії інтересів, а також відмовлятися від певних рекламних послуг Google.

Як я розумію, ви безпосередньо займаєтеся голосовим пошуком. Я ніколи не бачила, щоб хтось користувався голосовим пошуком, жодного разу взагалі. Хіба що коли люди за кермом і їм терміново потрібно дізнатися адресу.

Справа в тому, що коли хтось на тебе дивиться, то це менш природно - розмовляти з телефоном. У публічних місцях люди вважають за краще зберегти свою приватність і більше спілкуватися з телефоном не через голос. Але є ситуації, коли це абсолютно необхідно. Як приклад - як раз який ви привели, при водінні автомобіля. Я не вожу і не знаю, як у нас з цим, але в США, наприклад, це порушення закону, якщо людина активує свій телефон під час водіння. Якщо людині щось потрібно під час того, як він веде машину, то єдиний спосіб - це користуватися голосовим пошуком, іншого способу просто не дано. І це правильно, тому що бувають ситуації, коли ти просто не можеш тримати телефон в руках. Плюс бувають ситуації, коли тобі щось потрібно отримати швидко, тому що набирати складніше і повільніше, ніж запитати голосом. Бувають люди зі слабким зором, бувають ті, кому просто складно потрапляти в ці маленькі клавіші.

Все-таки голосовий пошук - це порівняно нова функція, яка з'явилася не так давно, користувачі продовжують її відкривати, вони продовжують вивчати, як це працює. Вони продовжують знаходити для себе ситуації, в яких це було б зручніше. Тому що всього лише 15 років користувачі шукають щось в інтернеті, забиваючи текст в пошукові вікна, і за ці 15 років вони виробили звичку. У ситуаціях, коли було б зручніше запитати телефон прямо так, вони цього не роблять, тому що сила звички переважує. Потрібен якийсь час на адаптацію, на розуміння того, як вписати нові сценарії в звичні. Але, без сумніву, голосових запитів стає більше, люди вчаться це використовувати в самих різних ситуаціях.

Якщо запитують, як готувати пиріг, то, швидше за все, це жінка. А якщо запитують, як варити сосиски, то, найімовірніше, чоловік

Ви вивчаєте взаємодія користувача з пошуковою системою. Начебто зрозуміло, але якщо детальніше - ви вивчаєте, що користувач хоче побачити в пошуковій системі?

Так. Фактично я вивчаю, що він хоче отримати. Навіть необов'язково те, що він хоче побачити, а яку реакцію користувач очікує від пошукової системи. Бо чим далі, тим більш природним стає мова взаємодії. Наприклад, одне те, що можна, вирушаючи в подорож, запитати, скільки градусів в Мілані, а потім запитати "а який там годину", і пошукова система зрозуміє, що ви цікавитеся часом в Мілані, - це вже нагадує те, як одна людина розмовляє з іншою людиною. Це більш природна мова, яка змушує нас менше відволікатися на побудова фрази.

Тобто чим більше природна мова, ніж більш природні відповіді на природній мові ми в змозі надати, тим більше ми робимо цей процес взаємодії людини з тими знаннями, які містяться в інтернеті, гладким і прозорим. Людині не треба думати, які слова вибрати, який підібрати запит. Тобто ми робимо так, щоб людина спілкувався з пошукачем так, як він спілкується з одним або приятелем дитинства. Відповідно, я займаюся тим, щоб розуміти, про що люди запитують, і відповідати їм так, щоб це не звучало незграбно.

співпрацюєте ви з лінгвістами ДЛЯ ВИВЧЕННЯ ТОГО, ЯК ЗМІНЮЄТЬСЯ МОВУ?

Безсумнівно, лінгвісти потрібні. Але справа в тому, що будь-яка людина, що володіє своєю рідною мовою, розуміє, коли з ним розмовляють правильною мовою. Навіть якщо хтось помиляється і будує фразу неправильно, ми завжди розуміємо, що є грамотним російською мовою. Тому, звичайно, у нас є свої лінгвісти, у нас є люди з досвідом комп'ютерної лінгвістики. Зрозуміло, у нас лежить стопка книг, які можуть підказати, як будувати фразу в найбільш складних випадках, коли ми, начебто освічені люди, опиняємося в глухому куті.

З точки зору лінгвістики, з моменту приходу Google в Росію як змінилися запити людини, яка зараз йде тенденція?

Мова став більш зрозумілим, більш усним, так би мовити. Запити стали розмовними. Коли в 2004-2005-му всі операційні системи були в своєму дитячому періоді, користувач намагався сформулювати запити в пошукові системи пташиною мовою, на пошуковому мовою, що не на природному. Вони звикли використовувати слова в називному відмінку, не погоджувати фрази, тобто, по суті, просто називати набір слів, який би вони хотіли побачити в документах. Якщо раніше ви б сказали "прогноз погоди Москва", то зараз ви можете сказати "прогноз погоди в Москві", "яка погода в Москві?", І це звучить як нормальне питання. По-друге, пошук за цей час обріс додатковими сервісами. З'явилися відео, карти, з'явився пошук по картинкам, люди починають шукати адреси. Зрештою, тепер людина може запитати "Чому вода не замерзає під льодом?" і отримати відповідь.

Getty Images запустили проект Lean In - це така бібліотека картинок, що зображують жінок найрізноманітніших професій. його мета - зруйнувати стереотипи про жінок. у Google є схожі проекти?

Насправді Google робить дуже багато для того, щоб дівчата приходили в IT і будували успішну кар'єру в цій області. Наприклад, Google заснував стипендію імені Аніти Борг, яка присуджується щорічно найбільш сильним дівчатам - студенткам в області комп'ютерних наук. А в березні цього року Google запустив серію заходів "Women Techmakers" - понад 100 зустрічей в 52 країнах світу, під час яких дівчата могли відвідати майстер-класи з планування кар'єри і обмінятися досвідом з провідними жінками-експертами в технологічній галузі. Та й у нас в компанії досить багато жінок-інженерів, які займають високі позиції.

Як змінилася особисто ваше життя за час роботи в Google?

В першу чергу я звикла до комфортної робочої обстановки. Вона включає в себе і людей, з якими я працюю, і проекти, які ми робимо, і те, як ця робота організована; доступність величезної кількості інформації і обчислювальних потужностей, та й просто побутові умови в офісі. У чомусь тутешня атмосфера схожа на атмосферу студентського кампусу з його мінімумом ієрархії, з безліччю планів і ідей і з великою кількістю різноманітних знань та інтересів.

Дивіться відео: The game that can give you 10 extra years of life. Jane McGonigal (Може 2024).

Залиште Свій Коментар