Полный индекс "Введения в информационный поиск"

Christopher D. Manning, Prabhakar Raghavan & Hinrich Schutze, “IIR Index full”, public translation into Russian from English More about this translation.

Translate into another language.

Participants

pbraslavski1294 points
Maxime625 points
iseg503 points
And others...
Join Translated.by to translate! If you already have a Translated.by account, please sign in.
If you do not want to register an account, you can sign in with OpenID.
Pages: ← previous Ctrl next
1 2 3 4 5 6 7

IIR Index full

Полный индекс "Введения в информационный поиск"

History of edits (Latest: Maxime 2 years, 11 months ago) §

{chi}^2 feature selection

выбор признаков на основе статистики хи-квадрат

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

{delta} codes

{delta}-коды

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

— Дельта-коды? AndreyBelov

{gamma} encoding

{gamma}-кодирование

History of edits (Latest: antilamer 2 years, 11 months ago) §

— Гамма-кодирование? AndreyBelov

{k} nearest neighbor classification

классификация методом ближайших соседей

History of edits (Latest: iseg 2 years, 5 months ago) §

— лучше без дефиса, по смыслу это и есть k соседей  vokov

— принято iseg

{k}-gram index

{k}-граммный индекс

History of edits (Latest: antilamer 2 years, 11 months ago) §

{L}_2 distance

евклидово расстояние

History of edits (Latest: iseg 2 years, 5 months ago) §

— {L}_2-расстояние. AndreyBelov

Лучше "евклидово": http://www.gramota.ru/slovari/dic/?wo... AndreyBelov

— Евклид однозначно победил Эвклида iseg

1/0 loss

бинарные потери

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

11-point interpolated average precision

средняя точность, интерполированная по 11 точкам

History of edits (Latest: Maxime 2 years, 11 months ago) §

— Метод оценки точности и полноты, применявшийся на первых 8 конференциях TREC. Maxime

20 Newsgroups

коллекция 20 Newsgroups

History of edits (Latest: AndreyBelov 2 years, 11 months ago) §

— Название коллекции документов (http://people.csail.mit.edu/jrennie/2...). Наверное, и не нужно переводить. AndreyBelov

A/B test

A/B-тест

History of edits (Latest: Maxime 2 years, 11 months ago) §

— метод тестирования многопараметрических систем. Maxime

accent

знак ударения

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

— В принципе, знак ударения - тоже диакритический. AndreyBelov

— просто "диакритика" iseg

access control lists

списки управления доступом

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

accumulator

накопитель

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

accuracy

правильность

History of edits (Latest: AndreyBelov 2 years, 11 months ago) §

— РОМИП pbraslavski

iseg: доля верных ответов, доля правильных ответов iseg@ имеется в виду "правильность", "корректность", "верность": "не-ошибка" ни первого, ни второго рода. соответственно fallout предлагаю назвать "доля неверных ответов" pbraslavski

More 5 comments

— решили - "правильность" - ок? iseg

active learning

активное обучение

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

ad hoc retrieval

поиск по произвольному запросу

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

— iseg@, речь о "поиске из головы", "спонтанном поиске", то есть НЕ выбор слов или понятий из словаря или классификатора, а поиск при помощи строки для ввода произвольного запроса pbraslavski

— Может тогда оставить просто "поиск по запросу" пользователя? itman

add-one smoothing

сглаживание прибавлением единицы

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

— Кавычки не нужны, наверное. AndreyBelov

Мне без "с" больше нравилось. AndreyBelov

adjacency table

таблица смежности

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

adversarial information retrieval

поиск в условиях противодействия

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

Akaike Information Criterion

информационный критерий Акаике

History of edits (Latest: antilamer 2 years, 11 months ago) §

algorithmic search

алгоритмический поиск

History of edits (Latest: iseg 2 years, 11 months ago) §

— в противоположность sponsored search pbraslavski

— предлагаю проще: "алгоритмический поиск" - это вполне устойчиво в seo-мире iseg

anchor text

текст ссылки

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

any-of classification

многозначная классификация

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

assessor

асессор

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

authority score

значение авторитетности (в методе HITS)

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

— iseg pbraslavski

auxiliary index

вспомогательный индекс (индекс для новых документов)

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

average-link clustering

кластеризация методом средней связи

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

— Среднесвязная кластеризация? По аналогии с односвязной и полносвязной. AndreyBelov

B-tree

B-дерево

History of edits (Latest: pbraslavski 2 years, 10 months ago) §

bag of words model

модель "мешок слов"

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

bag of words

мешок слов

History of edits (Latest: antilamer 2 years, 11 months ago) §

bag-of-words

мешок слов

History of edits (Latest: antilamer 2 years, 11 months ago) §

— Обычно переводят просто как "набор слов". Но "мешок слов" лучше :) AndreyBelov

bagging

бэггинг

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

— сайт BaseGroup.ru: dmitry_klyushin@  pbraslavski

я не нашел в книге pbraslavski

balanced F-measure

сбалансированная F-мера

History of edits (Latest: AndreyBelov 2 years, 11 months ago) §

Bayes error rate

байесовский уровень ошибки

History of edits (Latest: AndreyBelov 2 years, 10 months ago) §

— Источник: http://lib.mexmat.ru/books/8918/s3 AndreyBelov

А почему с прописной буквы? Все "байесовские", "байесовы" и "булевы" надо со строчной. Ср. в словаре Лопатина: "булев, -а, -о (от Буль): булева алгебра, булева операция, булево выражение, булево значение". http://gramota.ru/slovari/dic/?lop=x&... AndreyBelov

Bayes Optimal Decision Rule

байесовское оптимальное решающее правило

History of edits (Latest: iseg 2 years, 5 months ago) §

— Байес решающее правило не придумывал; поэтому оно не Байеса, а байесовское vokov

— принято предложение vokov iseg

Bayes risk

байесовский риск

History of edits (Latest: AndreyBelov 2 years, 10 months ago) §

Bayes' Rule

байесовское правило

History of edits (Latest: iseg 2 years, 5 months ago) §

— опять по принципу "не придумывал", хотя Маннинг, судя по апострофу после слова Bayes, думает, что придумывал iseg

Bayesian network model

сетевая Байесова модель

History of edits (Latest: iseg 2 years, 5 months ago) §

Bayesian networks

Байесовы сети

History of edits (Latest: iseg 2 years, 5 months ago) §

— суффикс -ian, -ean переводим краткой формой (традиция)? pbraslavski

— Ок, давайте краткой. AndreyBelov

Bayesian prior

(Байесова) априорная вероятность

History of edits (Latest: iseg 2 years, 5 months ago) §

— лучше просто "априорная вероятность", возможно (смотря по контексту, если надо уточнить) "байесовская априорная вероятность" vokov

— принято, с поправкой, что bayesian=байесов а bayes=байесовский iseg

Bernoulli model

модель Бернулли

History of edits (Latest: kolomeetz 2 years, 11 months ago) §

best-merge persistence

устойчивость к наилучшему слиянию?

History of edits (Latest: AndreyBelov 2 years, 10 months ago) §

— "Best-merge" неоднократно встречается в сочетании с разными терминами. Возможно, его следует переводить как "лучший Х для слияния", где Х-ом может быть кластер, кандидат и проч. ("best-merge cluster", "best-merge candidate"). Но не уверен. AndreyBelov

bias-variance tradeoff

компромисс между смещением и разбросом, компромисс между смещением и дисперсией

History of edits (Latest: iseg 2 years, 4 months ago) §

— можно и проще: "компромисс смещения и дисперсии" iseg

— это не дисперсия, см. 14.6, с. 286-288 pbraslavski

More 3 comments

— Дисперсия - это конкретно определяемая величина - средний кварат отклонения и ничто другое; под разбросом можно понимать и другие меры вариабельности данных; в частности Webb и Domingos определяют variance для задач классификации как другую величину, имеющую схожую интерпретацию. Для задач регрессии (откуда это всё и пошло) variance - это действительно в точности дисперсия. vokov

bias

смещение

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

— предрасположенность? pbraslavski

— Если по отношению к выборке, то нерепрезентативная выборка itman

— "смещение" iseg

biclustering

бикластеризация

History of edits (Latest: AndreyBelov 2 years, 11 months ago) §

— то же, что co-clustering (одновременная кластеризация слов и документов) pbraslavski

— Борис Григорьевич Миркин знает тонкую разницу между би- (это его термин) и ко- (которое вроде бы появилось позже). Но перевод правильный ;) vokov

bigram language model

биграммная языковая модель

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

bigram

биграмма

History of edits (Latest: pbraslavski 2 years, 10 months ago) §

— муж род "биграмм" встречается прмерно в 10 раз чаще (поиском проверял) iseg

— Что-то посмотрел я первые 50 результатов в "Яндексе", там везде женский род - "биграмма". AndreyBelov

binary independence model

бинарная модель независимости

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

— А "binary independence variables" как бинарные "переменные независимости"? Вообще здесь Binary - в смысле булевская. Может быть так и сделать "булевская независимая модель"? или "бинарная независимая модель"? iseg

— Я так понимаю, что переменные - "binary independent", а тут "binary independence". Т. е. "независимость" должна фигурировать в термине, по-моему. AndreyBelov

Binary Independence Model

бинарная модель независимости

History of edits (Latest: antilamer 2 years, 11 months ago) §

binary term incidence vector

бинарный вектор смежности термов

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

binary tree

двоичное дерево

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

biword index

индекс двусловий

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

biword

двусловие

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

blind relevance feedback

слепая обратная связь по релевантности

History of edits (Latest: AndreyBelov 2 years, 10 months ago) §

blocked sort-based indexing algorithm

блочное индексирование, основанное на сортировке

History of edits (Latest: antilamer 2 years, 11 months ago) §

blocked sort-based indexing

блочное индексирование на основе сортировки

History of edits (Latest: pbraslavski 2 years, 4 months ago) §

blocked storage

блочное хранение

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

— Блочное хранение? AndreyBelov

blog

блог

History of edits (Latest: kolomeetz 2 years, 11 months ago) §

BM25 weights

веса BM25

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

body of texts

корпус текстов

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

Boolean queries

Булевы запросы

History of edits (Latest: iseg 2 years, 5 months ago) §

— Все "байесовы" и "булевы" нужно со строчной буквы, а не с прописной. Я уже тут где-то приводил ссылку на словарь Лопатина. AndreyBelov

Boolean retrieval

Булев поиск

History of edits (Latest: iseg 2 years, 5 months ago) §

— Возможно, лучше "булевский". AndreyBelov

— ветхозаветный суффикс -ean принято переводить как краткую (как бы архаичную) русскую форму: "булева алгебра", "гамильтонов цикл", "лапласово чего-то", и тд. Хотя "булевский" чаще встречается в жизни, но религия требует "булев"? iseg

— Да, пусть будет "булев", в словаре Лопатина так. AndreyBelov

Boolean score function

Булева функция релевантности

History of edits (Latest: iseg 2 years, 5 months ago) §

— пусть уж здесь будет "релевантности" (термина нет в окончательном ПУ книги) pbraslavski

boolean model

Булева модель

History of edits (Latest: iseg 2 years, 5 months ago) §

boosted decision tree

бустинг решающих деревьев

History of edits (Latest: vokov 2 years, 9 months ago) §

— именно во множественном числе, т.к. бустинг одного базового классификатора смысла не имеет vokov

— что с усилением и форсированием - вместо бустинга - не катят? iseg

— де факто уже все говорят "бустинг", а усиление и форсирование навевают побочные ассоциации с чем-то военно-техническим vokov

boosting

бустинг

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

— сайт BaseGroup.ru dmitry_klyushin@  pbraslavski

bottom-up clustering

кластеризация "снизу вверх"

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

bowtie

модель "галстук-бабочка"

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

break-even point

точка равновесия

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

— точность=полнота pbraslavski

break-even

break-even point = точка равновесия

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

BSBI

= blocked sort-based indexing algorithm

History of edits (Latest: Maxime 2 years, 11 months ago) §

Buckshot algorithm

кластеризация методом "картечи"

History of edits (Latest: iseg 2 years, 4 months ago) §

— алгоритм кластеризации Maxime

— "buckshot" ето дробь... --> дробяной алгоритм кластеризации yea

buffer

буфер

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

caching

кэширование

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

capture-recapture method

метод повторного захвата (название популярного метода оценки размера популяции)

History of edits (Latest: iseg 2 years, 4 months ago) §

http://download.yandex.ru/company/pap... iseg

— this is a general statistical estimation method, not just for search output: http://en.wikipedia.org/wiki/Mark_and... yea

— вариант метода, который применяется в зоологии для оценки размера полуляции: поймать животных, пометить, выпустить, поймать снова и по доле помеченных оценить размер популяции pbraslavski

— понял: это из биологии. но тогда доминирует перевод "повторный захват". Реже "повторный охват" и "двойной охват" iseg

cardinality, in clustering

мощность, кардинальное число

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

— т.е. целевое количество кластеров pbraslavski

CAS topics

Content And Structure topics; запросы к системе поиска структурированной информации, содержащие помимо ключевых слов ограничения по структуре (INEX)

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

case-folding

игнорирование регистра

History of edits (Latest: iseg 2 years, 4 months ago) §

Comment was deleted

— "Преобразование регистра"? "Схлопывание", "свертывание", "складывание" и проч. как бы намекают, что имеется в виду перевод в нижний регистр, хотя на самом деле это может быть любое преобразование. AndreyBelov

— предлагаю: игнорирование регистра (case folding) против "использование истинного регистра" (truecasing) iseg

cashing

опечатка, в оригинале этого термина нет ни в индексе, ни в тексте

History of edits (Latest: Maxime 2 years, 11 months ago) §

— А это случаем не caChing? Т.е. кеширование itman

— ага, наверняка iseg

category

категория

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

centroid, in relevance feedback

центроид

History of edits (Latest: iseg 2 years, 11 months ago) §

centroid-based classification

классификация на основе центроидов

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

centroid

центроид

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

chain rule

цепное правило

History of edits (Latest: Maxime 2 years, 11 months ago) §

chaining, in clustering

образование цепочек при кластеризации (эффект метода одиночной связи)

History of edits (Latest: pbraslavski 2 years, 10 months ago) §

champion list

список чемпионов, список лучших кандидатов

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

— Список наиболее релевантных документов для конкретного словарного терма. Maxime

Предварительно составленный список. Maxime

top docs = champion lists = fancy lists Maxime

— Список лидеров? AndreyBelov

citation index

индекс цитирования

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

class boundary

граница класса

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

classification function

классифицирующая функция

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

— функция классификации? pbraslavski

classification

классификация

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

classifier

классификатор

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

CLEF

Cross Language Evaluation Forum

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

— имхо можно не переводить pbraslavski

— "Коллекция CLEF (Cross Language Evaluation Forum)"? AndreyBelov

click spam

скликивание (злонамеренные клики по рекламным объявлениям)

History of edits (Latest: Maxime 2 years, 11 months ago) §

clickstream mining

анализ кликов

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

— Просто "анализ кликов"? AndreyBelov

clickthrough log analysis

анализ кликов

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

— Вроде бы, это то же самое, что и clickstream mining? AndreyBelov

— как-то сложно получилось, предложил упростить iseg

— Наверное, оно ведь может относиться не только к кликам из поисковой выдачи (а, например, еще к кликам по рекламе на сайте)? Оставить просто "анализ кликов"? AndreyBelov

clickthrough mining

анализ кликов

History of edits (Latest: AndreyBelov 2 years, 10 months ago) §

— Возможно имеется в виду clickstream mining, синоним для clickthrough log analysis Maxime

clique

клика

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

— iseg@ тесно связанный подграф. также claque=клака – "группа поддержки" в графе  pbraslavski

cloaking

клоакинг

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

— надо будет пояснить в глоссарии: подмена содержимого страницы для робота поисковой системы iseg

cluster hypothesis

кластерная гипотеза

History of edits (Latest: l-i-d-y-a 2 years, 11 months ago) §

cluster pruning

отбрасывание кластеров

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

— iseg: отбрасывание кластеров  pbraslavski

cluster, in relevance feedback

кластер, в обратной связи по релевантности

History of edits (Latest: AndreyBelov 2 years, 10 months ago) §

— Зависит от перевода "relevance feedback". AndreyBelov

cluster-based classification

классификация, основанная на кластеризации

History of edits (Latest: antilamer 2 years, 11 months ago) §

cluster-internal labeling

(изолированное) именование кластера

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

— Противопоставляется "differential cluster labeling". AndreyBelov

— т.е. смотрим на распределение слов внутри кластера, не сравниваем с другими pbraslavski

cluster

кластер

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

CO topics

Content Only topics; запросы к системе поиска структурированной информации, содержащие только ключевые слова аналогично поиску неструктурированной информации (INEX)

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

co-clustering

совместная кластеризация

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

— Одновременная кластеризация документов и слов (то же, что biclustering) pbraslavski

collection frequency

частота в коллекции

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

collection

коллекция

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

combination similarity

комбинационная мера близости

History of edits (Latest: AndreyBelov 2 years, 10 months ago) §

— Ср. перевод "cosine similarity". А просто "similarity", соответственно, нужно будет переводить как "меру близости". AndreyBelov

— Есть вариант: многие предпочитают говорить "сходство", т.к. "близость" навевает ассоциации... vokov

complete search system

полноценная (полная) поисковая система

History of edits (Latest: Maxime 2 years, 11 months ago) §

complete-link clustering

кластеризация методом полной связи

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

— "Полносвязная кластеризация"? AndreyBelov

Термин "полносвязная кластеризация" встречается здесь: http://lib.mexmat.ru/books/28404/s3 AndreyBelov

complete-linkage clustering

=complete-link clustering

History of edits (Latest: AndreyBelov 2 years, 10 months ago) §

component coverage

покрытие компонентов

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

compound-splitter

разделитель составных слов

History of edits (Latest: AndreyBelov 2 years, 11 months ago) §

— разбиение составных слов? pbraslavski

compounds

составное слово

History of edits (Latest: AndreyBelov 2 years, 11 months ago) §

— В контексте compound (word) itman

computation of score

вычисление рейтинга, вычисление оценки релевантности

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

— Может лучше вычисление оценки релевантности? itman

concept drift

дрейф понятий, понятийный дрейф

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

— что-от как-то мощно получилось. предлагаю попроще: "уход от темы" или "уход от основного смысла" iseg

— Так он и в английском варианте довольно мощно выглядит. "Уход от темы" - нетерминологично, на мой взгляд. Можно "понятийный дрейф", но это тоже мощно. AndreyBelov

— это ситуация, когда тема/концепция со временим выражается другими словами pbraslavski

— Так почему тогда это "дрейф тем"? Тема-то обычно остается одна и та же, а вот ее понятийное наполнение меняется. Допустим, у нас есть рубрика "Популярные фильмы". Сегодня это "Ледниковый период 3" и "Трансформеры 2", а завтра "Ледниковый период 4" и "Трансформеры 3". Т. е. происходит как раз "дрейф понятий". И concept здесь - это, по-моему, все-таки "понятие" или "понятийный", а не "концепция". AndreyBelov

conditional independence, assumption

предположение об условной независимости

History of edits (Latest: AndreyBelov 2 years, 11 months ago) §

confusion matrix

матрица ошибок

History of edits (Latest: pbraslavski 2 years, 9 months ago) §

connected component

связная компонента

History of edits (Latest: pbraslavski 2 years, 11 months ago) §

connectivity queries

запросы для проверки ссылочной связности

History of edits (Latest: iseg 2 years, 11 months ago) §

— это про сервер обслуживающий запросы вида "ссылается ли страница 1 на страницу 2" iseg

connectivity server

сервер проверки ссылочной связности

History of edits (Latest: iseg 2 years, 11 months ago) §
Pages: ← previous Ctrl next
1 2 3 4 5 6 7