Търсачка

Банер

Дипломни Информатика, ИТ МАШИНАТА ЗА ТЪРСЕНЕ FAST - КОНКУРЕНТ НА GOOGLE


Дипломна работа, 68 стандартни страници, съдържа таблици, формули, графични елементи, има апарат
Цена: 4.80лв.
Безплатно
Спестявате: 100.00%
Задайте въпрос за този материал

Normal 0 21 false false false MicrosoftInternetExplorer4 /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin:0cm; mso-para-margin-bottom:.0001pt; mso-pagination:widow-orphan; font-size:10.0pt; font-family:"Times New Roman"; mso-ansi-language:#0400; mso-fareast-language:#0400; mso-bidi-language:#0400;}

СЪДЪРЖАНИЕ

УВОД

Гл. І В ерата на новите технологии

1. 1. Интернет

1. 2. WWW

1. 3. Машини за търсене на информация

1. 4. Стратегии за търсене

Гл. ІІ Машините за търсене Fast и Google в борба за потребители

2. 1. Google.com

2. 1. 1. Технология на търсене

2. 1. 2. Какво може Google

2. 2. Машината за търсене Fast- конкурент на Google

2. 2. 1 Технология на Fast

2. 2. 2. Конкурентност на Fast

2. 2. 3. Продукти на Fast

2. 2. 4. Стратегия на търсене

2. 2. 5. Клиенти на Fast

Заключение

Терминологичен речник

Информационни източници


УВОД

Използването на Интернет вече е нещо съвсем обичайно и се е превърнало в неизменна част от живота на хората. Потребителите все по-умело си служат с мрежата и изоставят обичайните медии като вестник, радио и телевизия, за да използват възможностите на нета.

На добра посещаемост се радват сайтовете, даващи полезна информация /рецепти, туристическа информация, култура/. Засилва се тегленето на музика, филми и софтуер, което далеч не радва големите имена в съответните сектори, въпреки опитите за легализация на този доходоносен бизнес.

Предпочитано занимание на доскоро беше разменянето на съобщения и имейли. Днес обаче се ползва целият капацитет на мрежата – информационни сайтове в помощ на образованието, професионалната реализация, търговията и обществения живот. 61 % от потребителите на Интернет смятат, че той е подобрил неколкократно продуктивността и културата им и се е превърнал в необходим елемент в професионалната сфера.

Целта на настоящата дипломна работа е да представи достъпна информация на широк кръг заинтересовани и неспециалисти, и да изясни:

1. Какво всъщност представлява Интернет;

2. Какви са основните стъпки в света на електронното търсене и намиране на конкретна информация;

3. Какво представляват машините за търсене на информация и как те могат да бъдат използвани;

4. Подробно да бъдат изведени качествата и конкурентно способността+ на две от най-мощните в света машини за търсене на информация – Google и FAST.

Във WWW стои огромно количество ценна информация, но липсата на цялостна и пълна организация прави трудно намирането й. Ако знаем как да използваме Мрежата за откриване на отговора на почти всеки въпрос бързо и изчерпателно, значи сме овладели най-ценното онлайн умение - да се намери “игла” в най-голямата “купа сено” в света. За щастие в наша помощ в Web неуморно сърфират машините за търсене, които намират и индексират милиони страници, съдържащи отговор на въпросите ни. Всичко, което трябва да направим, е да изразим точно предмета на търсене и основните средства на Web ще ни насочат точно към това, което ни трябва. В рамките на няколко часа от Мрежата може да се изтегли информация, която наистина си струва. В един последващ момент това може да се окаже най-добрата инвестиция, която някога сме правили.


ГЛ. І В ЕРАТА НА НОВИТЕ ТЕХНОЛОГИИ

1. 1. ИНТЕРНЕТ

Интернет може да е най-новият медиен феномен, но всъщност като концепция е по-стар от повечето си потребители. Тя води началото си от 60-те години на ХХ век – много преди някои да е пуснал в употреба термина “информационна супер магистрала”. Разбира се, няма съмнение, че Мрежата заслужва сегашното ниво на внимание, тъй като представлява гигантска стъпка в световните комуникации, въпреки че към настоящият момент все още се разглежда като незавършен продукт.

Концепцията на Мрежата може да не се е родила в стратегическия отдел на Microsoft, но изиграва своята роля в някогашната надпревара за световно господство. През 1957 г. в разгара на Студената война, Съветският съюз изпраща в орбита първият “Спутник”. Това е победа над САЩ в космическото пространство. Надпреварата продължава. В отговор Министерството на отбраната на САЩ, за да форсира своя технологичен прогрес, формира свой отдел, който да отговаря за авангардни изследователски проекти и разпределението на отпусканите субсидии - ARPA /Advanced Research Projects Administration/, a 12 години по-късно се ражда ARPANet - проект за разработка на мрежа за военни комуникация, обединяваща множество компютри от различен тип, която да продължи да функционира задоволително дори ако някои от компютрите й бъдат извадени от строя в резултат на атака с ядрено оръжие. Концепцията за независими интелигентни процесори, обединяващи своите ресурси в мрежа за своето време е една смела новаторска стъпка в нова и непозната територия, която от своя страна изисква разработка на нов хардуер, софтуер и методи за свързване. Или с други думи – изграждане на първата децентрализирана компютърна мрежа в света с осигурена връзка между компютрите й посредством обикновени телефонни линии. Тези изисквания определят и появяването на т. нар. мрежов протокол, който включва технология за предаване на информация, определена като пакетна комуникация /IP-пакет/.

Въпреки, че в началото ARPANET е била малка и е свързвала само 3 университетски компютъра в Калифорния и един такъв в Юта, тя бързо увеличила размерите си и обхванала целия континент.

Това, което гарантирало надеждността на мрежата, се свързвало с динамичното пренасочване. Ако една от връзките бъде разрушена от вражеска атака, информацията от нея автоматично се пренасочва по останалите. По принцип се приемало, че мрежата не е надеждна и всеки неин елемент може да бъде заменен от друг. Затова мрежата е така изградена, че да изисква минимум информация от компютърните клиенти. Потребителят трябва само да въведе данните в IP-пакета и да го адресира правилно, след което съобщението може да се “пейсне” /”постави”/ в мрежата. Отговорността за действителното осъществяване на връзката се носи от двата компютъра – изпращащия и приемащия съобщението. Философията на мрежата по същество се състои в това, че всеки компютър в мрежата може да се свързва като равен с всички останали компютри.

Тъй като ARPANET се радвала на голям успех, всички университети от страната желаели да се включат. Този успех означавал, че ARPANET все по-трудно се поддавала на управление, особено като се имало предвид постоянното увеличение на университетските сайтове. Тогава тя била разделена на две части:

1 MILNET – съдържаща сайтове на военните;

2 Новата и по-малка ARPANET, която съдържала всичко друго, без военните сайтове;

Двете мрежи останали свързани благодарение на техническата схема Интернет Протокол /IP/, позволяваща информацията да се пренасочва от едната мрежа към другата, когато това е необходимо. Въпреки, че е започнал само с две мрежи IP е така проектиран, че да позволява общуване между десетки мрежи. На онзи етап на развитие мрежите са се състояли от малък брой компютри и множество отдалечени терминали, които са можели да общуват само с централните системи, но не и помежду си.

През 70-те години е внедрена електронната поща, FTP, Telnet и първоизточника на съвременните Usenet нюз-групи. Десетки изследователски агенции и университети се присъединяват към мрежата. В много страни извън САЩ също се появяват IP мрежи, спонсорирани от местните телефонни компании или управлявани от независими национални или регионални доставчици. Първите международни връзки са осъществени през 1973 г. с University College в Лондон, Англия и Radar Establishment в Норвегия. Почти всички страни са свързани директно или индиректно към някоя американска мрежа, което означава, че те могат да обменят информация помежду си.

В началото на 80-те години се появяват NNTP /Network News Transfer Protocol/, DNS /Domain Name System/ и европейските мрежи EUNet /European UNIX Network/, MiniTel /широко възприета френска потребителска система/, JANET /Joint Academic Network/, Japanese UNIX Network.

През 1980 г. започва и активното компютиризиране на университетите. От малък брой огромни машини с времеделене /time-sharing/, всяка от които обслужвала стотици потребители едновременно, се преминава към огромен брой по-малки индивидуални работни станции /workstations/. Един сайт на ARPANET можел да бъде разположен не на един или два компютъра, а на стотици. Всяка работна станция била значително по-бърза от потребителските системи на 70-те години и генерирала информационен трафик, достатъчен да претовари вече недостатъчно ефективната ARPANET.

През 1982 г. DARPA /наследникът на военния отдел ARPA/ в лицето на д-р Винсънт Дж. Сърф и Робърт Кан създава своя комуникационен протокол TCP/IP /Transmission Control Protocol/Internet Protocol/, благодарение на който днес съществува Интернет.

Той представлява реализирана по програмен път съвкупност от правила и условия, която осигурява обмена на данни между компютри от всякакъв вид по метода на пакетната информация. Благодарение на TCP/IP компютрите, влизащи в мрежата, могат да общуват помежду си независимо от различията по отношение на клас, марка, операционна система и други характеристики

Приложният софтуер за ползване на мрежата се основава на модела “клиент/сървър” за организация на обслужването на потребителите. Съобразно този модел той е разделен на две части за клиента /компютъра, искащ информация/ и за сървъра /т.е. обслужващия компютър, т. нар. хост/. Клиентският софтуер “превежда” запитването на потребителя в разбираем за сървъра вид и осъществява връзката с него. Сървърният софтуер управлява информационните ресурси на сървъра и отговаря на отправените към него запитвания.

Двата протокола работят съвместно, за да осигурят връзката. ТСР взема данните, които единият компютър иска да предаде на друг, и ги разделя на малки, лесни за управление части като изпраща всяка част към нейното направление и поема отговорността за пристигането им в правилен ред, за да могат да се обединят отново. IP отговаря всяка част да бъде изпратена и получена от източника до направлението.

1983 г. – създава се BITMET – информационна мрежа в сферата на образованието и военното дело.

1984 г. – ЕАRN – Европейска академична мрежа със силни клонове в Англия, Франция, Холандия, позволяваща непрекъснат и актуализиран обмен на научна информация.

През 1986 г. Националната научна фондация на САЩ /NSF/ решава да изгради 5 суперкомпютърни центъра за научни изследвания като използва за основа ARPANET. Посредством нея научните работници щели да изпращат своите програми, които да бъдат обработени в суперцентровете и резултатите да им бъдат върнати обратно. Намерението да се използва ARPANET не се осъществило по ред политически и технически причини. Тогава NSF изгражда своя собствена, по-бърза мрежа NSFNET, в която свързала своите свръхкомпютърни центрове като създава и множество регионални мрежи, които да обхванат потребителите от всеки регион. Всяка регионална мрежа е свързана с NSFNET.

До 1990 г. много от потребителите се пренасочват от ARPANET към NSFNET, въпреки че тя вече не поддържа основното си предназначение.

1991 г. – създават се Gopher и WAIS с база данни от документи и архиви.

До 1994 г. в самият Интернет се обособяват няколко големи комерсиални Интернет мрежи, част от които са ръководени от големи и наложили се на пазара организации като IBM и Sprint, а други – от специализирани Интернет компании, като PSI и Alternet, AOL и Compuserve.

 

------------------------------------------------------

 

 

Normal 0 21 false false false MicrosoftInternetExplorer4 /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin:0cm; mso-para-margin-bottom:.0001pt; mso-pagination:widow-orphan; font-size:10.0pt; font-family:"Times New Roman"; mso-ansi-language:#0400; mso-fareast-language:#0400; mso-bidi-language:#0400;}

ЗАКЛЮЧЕНИЕ

През 1995 г. Altavista е машината за търсене с най-голяма база категоризирани данни. Към 2004 г. Google и FAST притежават най-големите бази от данни в света. Нито една от тях обаче не покрива самостоятелно 50 и повече процента от Интернет пространството, тъй като ежедневно към мрежата се добавят над 8,000,000 Web страници. Все още няма търсачка, която да е способна да поддържа такава скорост на индексиране и категоризиране.

Мениджърите желаят машината на най-доброто търсене да фокусира върху по-малко отговори, но високо relevancy /точност и съответствие на отговорите/ за потребителите. Преимущество ще бъде способността за по-голяма сигурност и конфиденциалност за вътрешни документи, както и търсенето в собствени бази данни, в Интранет и в мрежата, като се сортира по дата, автор, актуалност, и много другите параметри. Компаниите, които ще спечелят битката за клиентите от “висок клас” /големите тръстове, корпорации правителства/, трябва непрекъснато да индивидуализират своите продукти, да ги правят евтини и уникални, и по този начин да имат предимство пред конкурентите си.

Днес можем да кажем, че Google управлява цялото Интернет пространство налагайки своята политика, реклама и цензура, но само FAST успява да пропълзи и филтрира тъмната и дълбока Мрежа, и да достигне точно тази информация, която е нужна на потребителя.

През 2004 г. компаниите са заинтересовани да намерят по-умни начини за бразуване в големия масив информация. Според водещи аналитици това е началото на нова вълна в еволюцията на търсещите машини и в скоро време ще са налице първите резултати от конкрентната надпревара. Така че със сигурност в Интеренет пространството тази година ще е доста нажежено – всеки ще търси начин да надделее над Google, но пък тя със сигурност няма да се съгласи да слезе от трона доброволно.


ТЕРМИНОЛОГИЧЕН РЕЧНИК

Access Provider - /доставчик на достъп/. Компания, която продава Интернет връзки. Нарича се още Internet Service Provider /ISP/ - доставчик на Интернет услуги/;

ADSL /Asynchronous Digital Subscriber Line/ - Високоскоростни връзки по медни проводници – до 6 Mbps сваляне и 640 Kbps качване;

AOL / America Online/ - Към момента най-популярната онлайн услуга в света;

ASCII /American Standard Code for Information Interchange/- Текстов формат, който може да бъде прочетен от всеки компютър. Наречен също така “обикновен текст” /plain text/;

Beta version – бета версии или т. нар. “пробни варианти” на даден продукт. Разпространяват се безплатно като част от процеса на тестване при разработването на комерсиален продукт. За тях потребителите не плащат, защото не са завършен продукт. Често пъти обаче те са достатъчно добри за изпълнението на множество задачи, тъй като са последна дума на технологията. Но при всички бета-версии винаги трябва да се очакват бъгове и неуредици, които провокират многократно рестартиране на програмата или работещия компютър;

Bps /Bits per second/ - битове в секунда. Честота на трансфер на данни между два модема. Битът представлява най-малката единица данни;

Browser /браузър/ - Програма, като Netscape или Internet Explorer, позволяваща ви да свалите и показвате Web документи;

Directory – йерархични каталози, указатели на World Wide Web; главните тематични заглавия са разделени на по-малки области, които на свой ред са разделени по теми и т.н. Щракването върху произволна категория или под категория извежда на екрана друга страница с допълнителни елементи от йерархията.

Domain – домейн - тази част от името, която посочва детайли за хоста, като негово местоположение и дали е част от комерсиална /.com/, правителствена /.gov / или образователна /.edu/ единица;

FAQ - Документ, който отговаря на често задавани въпроси по определена тема. Всяка нюз-група има поне един такъв документ;

File - Всякакъв вид информация, съхранена на компютър, например програма, изображение или документ;

FTP /File Transfer Protocol/ - Стандартен метод за преместване на файлове в Интернет;

Chat – бърборене; разговор с познати, непознати и запознанства по цял свят чрез Интернет

Kommunication – процес на приемане и предаване на разнообразни информационни съобщения между потребителите. Съобщенията не е задължително да са словесни по форма.

Host – Компютър, предлагащ някакъв тип услуги на потребителите в Мрежата. Нарича се още сървър.

HTML /HyperText Markup Language/ – Езикът, който се използва за създаване и форматиране на Web документи.

HyperText Links – хипертекстови връзки. Връзки, достъпни чрез щракване с мишката, или “горещи точки”, които свързват страници в Web една с друга.

Internet Explorer – Предизвикал много спорове Web-браузър, произведен от Microsoft;

Index - индексът извлича ключовите думи от зададените критерии за търсене /ключови думи могат да бъдат всички думи, без съюзи и междуметия/ и създава свои списък за търсене. Потребителят претърсва индекса, като указва своя ключова дума, а индексът намира всички вписвания, които съдържат думата или са комбинирани с нея. Индексите “не разбират” какво означават думите. Напр. ако търсите с думата program, индексът ще открие всички образователни, компютърни, театрални програми и пр. останало, съдържащо тази дума. По-добър вариант за търсене са указателите – това са списъци, съдържащи раздели с отделни категории. Търсенето става като се намери съответната категория и се разгледа нейното съдържание. Указателите са така организирани, че всички елементи на интересуващата ви категория вероятно са свързани с това което търсите.

Указателите се изготвят от хора, докато индексите се създават /напълно или отчасти/ автоматично, и са по-пълни и се актуализират се по-често.

Съществува известно припокриване между индекси и указатели. Yhoo, най-известният указател за Web страници, дава възможност да се търси по ключова дума, а в повечето индекси елементите са обособени в общи категории,което позволява да се ограничи търсенето.

IP /Internet Protocol/ - Най-важният протокол, на който е базирана световната мрежа Интернет. Дефинира начина по който пакетите с данни достигат от източника до местоназначението;

IRS /Internet Relay Chat/ - Интернет система, с помощта на която в реално време можете да говорите чрез текст или аудио с други потребители;

Link - /връзка/. В хипертекста, както и в Web страница, връзката представлява референция към друг документ. Когато щракнете с мишката върху връзка в браузър, този документ ще бъде зареден и показан, възпроизведен или свален в зависимост от неговото естество;

Robot - Програма, която автоматизира задачи в Мрежата като сравняване на базите от данни на машина за търсене или автоматично отговаряне в IRS. Нарича се още Bot или Spider ;

Search Engine - Търсачка, машина за търсене. Представлява база данни, съставена от извадки от Web страници, в която можете да търсите препратка към някаква информация в Мрежата;

Server - Компютър, който извършва услуги в мрежа;

Spam - /спам/. Изпращане на едно и също съобщение на множество неподходящи нюз-групи или адреси;

Surf - сърфиране, преминаване от страница на страница в черз проследяване на връзки;

TCP/IP /Transmission Control Protocol/Internet Protocol/ - Протоколите, които управляват Интернет;

URL /Uniform Resource Locator/ - Еднороден локатор на ресурси – стандартен формат, използван за хипертекстови връзки в Интернет, например: http://net.gurus.com; Нарича се още URI /Universal Resource Identifiers/ - универсален идентификатор на ресурси или система на адресиране в W.W.W., което също обхваща връзки към неща като подчасти на съобщения за електронна поща.

Usenet /Users Network/ - колекция от мрежи и компютърни системи, които обменят съобщения, организирани тематично в нюз-групи;

The Net = Интернет, Мрежата;

Netscape – Популярен Web браузър, създаден от едноименна компания

Plug-in – Програма, която се вмества в друго приложение;

Portal – портал. Web сайт, специализиран в насочване към други сайтове;

Protocol – Общоприет начин за общуване между две мрежови устройства;

World Wide Web /W W W, Web/ - Графични и текстови документи, публикувани в Интернет, които са свързани чрез хипертекстови връзки. Една Web страница е отделен документ, а всеки Web сайт е система от свързани документи; За ползването на тази система се изисква специална програма, наречена браузър.


ИНФОРМАЦИОННИ ИЗТОЧНИЦИ

1. Бакърджиева,Теодора. Съвременни комуникации – София: Славена, 2000. 209 стр.

2. В м р е ж а т а / / бр. 1-47, 2003 г.

3. Крейнак Джон, Джой Хебрейкен. Энциклопедия Интернет. - С. Петербург : Питер, 2000. 684 стр.

4. Левин, Дж., А. Райнхолд, М. Левин Янг. Интернет справочник. – София : АлексСофт, 2001. 503 стр.

5. Петков, Красимир. Интернет – ключ към безграничната информация. – София : ЛИК, 1998. 158 стр.

6. Пълен Интернет справочник. – София : СофтПрес, 2000. 627 стр.

7. Ъндърдейл Брайън, Е. Уилет. Интернет библия. – София : АлексСофт, 1999. 947 стр.

8. http://clients.ttm.bg./kermit/prom.ltm#1

9. http://trebuda.narod.ru/poiskgog.htl

10. www.alltheweb.com

11. www.fastsearch.com

12. www.google.com

13. www.lycos.com

14. www.netbg.net

15. www.infoweek.bg


Коментари на клиенти:

Все още няма коментари за този материал.
Моля, влезте в системата с потебителско име и парола, за да оставите коментар.


повече категории
Компютърни системи

За сайта

Кой е онлайн

В момента има 683 посетителя и 17 потребителя в сайта

Намерете ни в Facebook


© 2010 znanieto.net Всички права запазени.
znanieto.net избра за свой хостинг партньор Viscomp.bg

Изграден с помощта на Joomla!.