Помощник
|
Что такое парсер,как его написать и как его использовать? |
dhfj1985
|
Сообщение
#1
|
||
|
|
||
|
|||
alexdrob |
24.7.2010, 21:32;
Ответить: alexdrob
Сообщение
#2
|
|
Парсер это: маленькая программка написана на каком(?) языке Это не обязательно программка, точнее обычно не программка а скрипт. Написать можно в принципе на любом языке) В вашем случае это наверное будет php Парсер нужен я так понемаю для обработки данных XML-потока не обязательно XML просто для отделения нужных вам данных от остальных данных. Что такое XML-поток Ну я так понимаю это просто XML файлик генерируемый каким то скриптом на стороне сервера Вообщем в кратце вашь XML потом будет выглядеть как то так <root> <book> <name>Уроки PHP</name> <price>750</price> </book> <book> <name>Уроки C++</name> <price>920</price> </book> <book> <name>Уроки JavaScript</name> <price>300</price> </book> </root> Все строки конечно вымышленные)) Вот парсингом будет получения названий книг и их цен. |
|
|
SOKOJI |
24.7.2010, 21:38;
Ответить: SOKOJI
Сообщение
#3
|
|
Парсинг - обработка. Обработка каких-либо данных, и разбиение их на нужные участки.
Например, у нас есть html-страница. Ее можно распарсить так, чтобы парсер нашел в ней все ссылки, к примеру. Возможно, поможет понять вот это: http://ru.wikipedia.org/wiki/%D0%A1%D0%B8%...%BB%D0%B8%D0%B7 |
|
|
Arks |
25.7.2010, 0:04;
Ответить: Arks
Сообщение
#4
|
|
Существует два вида парсинга:
1. Парсинг средствами(функциями, классами, библиотеками) того или иного языка. Везде сейчас есть готовые классы и методы для работы с XML. 2. Парсинг регулярными выражениями - универсальный почти для всех языков программирования, но более сложный способ, чаще применяется для выцепления нужного html с любых сайтов. |
|
|
MetSerp |
25.7.2010, 2:55;
Ответить: MetSerp
Сообщение
#5
|
|
|
|
|
dhfj1985
|
Сообщение
#6
|
|
ребят научити пользоватся XML и обработчиком для него,то все нормальные партнерки на XML. А я в нем "0" я только знаю html.
Какая его структура,как использовать его с помощью обработчика и все такое,или где можно найти инфу про это дело? к примеру вот кусок кода: <response type="gameboss ver2.0"> как его правильно оформить,для парсера?
<result type="games"> <ITEM> <ID> 949 </ID> <RATE> 9999 </RATE> <NAME_URL> lamp_of_aladdin_rus </NAME_URL> <TYPE> 1 </TYPE> <ADDED> 2010-08-09 </ADDED> <SIZE> 118830 </SIZE> <NAME> Лампа Алладина </NAME> <MEDIUM_PIC> http://gameboss.ru/gfx/mediums/game_471.jpg </MEDIUM_PIC> <SMALL_PIC> http://gameboss.ru/gfx/smalls/game_471_1.jpg </SMALL_PIC> <DOWNLOAD_LINK> http://gameboss.ru/getfile.php?url=http://...n_58017_rus.exe </DOWNLOAD_LINK> </ITEM> <count> 1 </count> </result> </response> |
|
|
SOKOJI |
16.8.2010, 0:37;
Ответить: SOKOJI
Сообщение
#7
|
|
dhfj1985, XML - язык структурирования данных. Проще всего разбирать XML-документ, в котором верно расставлены отступы. Уроков в интернете много.
А парсер.. На каком языке будет парсер? Собственно, для php 5 существует мегаполезное расширение - simpleXML, которое позволяет обращаться к любым данным из XML документа по средствам ООП синтаксиса ($thing->book->author) и т.д. Про расширение также можно почитать в интернете. |
|
|
Flok |
16.8.2010, 1:17;
Ответить: Flok
Сообщение
#8
|
|
Агрррх, что бы я делал без "применения исходного форматирования" денвера
вот, как это должно выглядеть в нормальном виде: <response type="gameboss ver2.0"> <result type="games"> <ITEM> <ID> 949 </ID> <RATE> 9999 </RATE> <NAME_URL> lamp_of_aladdin_rus </NAME_URL> <TYPE> 1 </TYPE> <ADDED> 2010-08-09 </ADDED> <SIZE> 118830 </SIZE> <NAME> Лампа Алладина </NAME> <MEDIUM_PIC> http://gameboss.ru/gfx/mediums/game_471.jpg </MEDIUM_PIC> <SMALL_PIC> http://gameboss.ru/gfx/smalls/game_471_1.jpg </SMALL_PIC> <DOWNLOAD_LINK> http://gameboss.ru/getfile.php?url=http://gameboss.ru/download/lamp_of_aladdin_58017_rus.exe </DOWNLOAD_LINK> </ITEM> <count> 1 </count> </result> </response> сам я писал парсер, но без ооп. просто на основе регулярных выражений вырезал цитаты с главной страницы баша, очищая страницу от рекламы, ссылок и т.д. по-нубски, но работало ))) не вздумайте xml разбирать через регулярки! =) ждём ответа профессионала ) |
|
|
SOKOJI |
16.8.2010, 1:23;
Ответить: SOKOJI
Сообщение
#9
|
|
ждём ответа профессионала ) Чо тут ждать-то?) PHP предоставляет достаточно инструментов для парсинга XML. Все зависит от требований и пожеланий. Но вот через регулярки - это да, это пипец :D сам я писал парсер, но без ооп. просто на основе регулярных выражений вырезал цитаты с главной страницы баша, очищая страницу от рекламы, ссылок и т.д. Уже давненько такая идея есть. Граббить цитаты и вставлять куда-нибудь. Хоть софтину пиши, чтобы поверх всех окон и цитаты выводила xD |
|
|
Flok |
16.8.2010, 1:36;
Ответить: Flok
Сообщение
#10
|
|
SOKOJI, в принципе структура у баша понятна, реализуется легко)
я как-то пытался разбирать инфу из одного xml файла. и даже совет дали - распечатать содержимое переменной. но из-за отсутствия знаний по ооп я ничего не понял :hihi: |
|
|
|
Похожие темы
Тема | Ответов | Автор | Просмотров | Последний ответ | |
---|---|---|---|---|---|
Во что сегодня инвестировать? Делимся своими приносящими прибыль вариантами |
74 | traveliver | 4885 | Сегодня, 11:39 автор: Skyworker |
|
Арбитражники, как ведете учет расходов и доходов? | 11 | Boymaster | 1801 | 17.4.2024, 23:35 автор: Boymaster |
|
Как вывести деньги в Украине с заблокированного Юмани ? | 29 | freeax | 4810 | 17.4.2024, 1:19 автор: sergio11 |
|
A-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парсеров. | 353 | Forbidden | 279270 | 11.4.2024, 17:07 автор: AParser_Support |
|
Как вы отдыхаете от работы за компом | 148 | adw-kupon.ru | 19708 | 8.4.2024, 10:37 автор: Skyworker |
Текстовая версия | Сейчас: 19.4.2024, 15:33 |