эффективный парсинг

User avatar
Win32nipuh
Уже с Приветом
Posts: 2489
Joined: 04 Feb 2002 10:01
Location: Слава Україні!

Да...

Post by Win32nipuh »

Почему Вы не упоминаете, что ваш аналитик вводит слово для поиска так, как он думает, а ждет в результатах все словоформы по правилам английского языка? Или не так? Или он должен в точности вводить слово, как он где-то там встречается?
В этом случае поиск LIKE не поможет.

И вопрос: Вы указали конфигурацию сервера. У одного нашего клиента в Америке была почти такая же, были постоянные жалобы и на поиск, и на производительность.
Потом он установил кластер для SQLServer, SCSI RAID, 8 Г памяти, 4 процессора, после этого - тишина.Все работает :-)
111001
Posts: 11
Joined: 04 Apr 2004 01:40

Post by 111001 »

8K wrote:Не, я в этом не участвую.


Не все так страшно. Параллельная обработка последовательности входящих событий - весьма распространенная штука.
shadow7256
Уже с Приветом
Posts: 9392
Joined: 18 Mar 2004 15:11
Location: New York -> FL

Re: Да...

Post by shadow7256 »

Win32nipuh wrote:Почему Вы не упоминаете, что ваш аналитик вводит слово для поиска так, как он думает, а ждет в результатах все словоформы по правилам английского языка? Или не так? Или он должен в точности вводить слово, как он где-то там встречается?


это зависит от того , что он вводит. Он может строить запросы с использованием предиткатов "Bill AND Bush NOT gay marridge" допустим. Full text search позволяет это делать. Также он может ввести " cut* " и тогда ему вернутся тексты, которые содержат любое слово начинающиеся с букв CUT. Если он просто ввел слово, то вернутся тексты содержащие строго это слово.

И вопрос: Вы указали конфигурацию сервера. У одного нашего клиента в Америке была почти такая же, были постоянные жалобы и на поиск, и на производительность.
Потом он установил кластер для SQLServer, SCSI RAID, 8 Г памяти, 4 процессора, после этого - тишина.Все работает :-)


Вопрос как работает? Он использует full text search? насколько быстро происходит индексация текста и как много текста поступает в секунду?
8K
Уже с Приветом
Posts: 5552
Joined: 20 Mar 2001 10:01
Location: SFBA

Post by 8K »

111001 wrote:
8K wrote:Не, я в этом не участвую.

Не все так страшно. Параллельная обработка последовательности входящих событий - весьма распространенная штука.

Я не боюсь. Напугал доярку сиськой (ц).

Я просто знаю, что это не для чайников задача, поэтому охота искать на свою ж. приключений - пожалуйста, но я тут не советчик.Задача в другой плоскости решается.
Увидев друга, Портос вскрикнул от радости...
shadow7256
Уже с Приветом
Posts: 9392
Joined: 18 Mar 2004 15:11
Location: New York -> FL

Post by shadow7256 »

Если поставим два процессора и разнесем процессы Сиквела и Индексирования по ним, но действительно ли сильно улучшится скорость обработки?

У меня сейчас стоит один процессор и я попробовал выставить affinity либо у сиквельного процесса либо у поиска - система отфутболила меня, сказала не имеешь право это делать.

А для других процессов (не системных) дает выставлять. Кстати процессор один а видит она его как два. Это из за hyperthreading?
SBolgov
Уже с Приветом
Posts: 14006
Joined: 17 Jun 2003 04:41

Post by SBolgov »

shadow7256 wrote:Кстати процессор один а видит она его как два. Это из за hyperthreading?

Да.

(Если у Вас Pentium 4, конечно. :lol:)
Не гоните, и не гонимы будете...

Return to “Вопросы и новости IT”