Nový formát XML výstupu pro Zboží.cz (XML feed)

Největší český srovnávač produktů Zboží.cz od Seznamu.cz bude od 1. října 2009 zpracovávat XML výstupy eshopů v novém formátu. Některé položky stávající struktury XML feedu se změní, přibývají další. Vypadá to, že Seznam připravuje po delší době rozsáhlejší upgrade svého zbožového vyhledávače.

Především dojde k nahrazeníelementu AVAILABILITY, pánové na Seznamu uznali, že jde tak trochu o zastaralou záležitost. Šlo o dostupnost zboží v hodinách, nicméně s tímto elementem většina eshopů stejně moc nepracovala a dostupnost v čase neuváděla. Prostě vložili do elementu hodnotu 0, tedy že zboží je skladem. Tento element bude nyní nahrazen prvkem DELIVERY_DATE.  Jde o dobu vyřízení objednávky, dodací doba musí být uváděna jako doba od přijetí platby do expedice zboží. Element lze vyplnit například následujícím způsobem:

<DELIVERY_DATE>ihned</DELIVERY_DATE>

nebo

<DELIVERY_DATE>0</DELIVERY_DATE>

nebo počet dnů (v celých číslech)

<DELIVERY_DATE>3</DELIVERY_DATE>

nebo bude-li produkt dostupný až od určitého data (RR-MM-DD)

<DELIVERY_DATE>2009-12-31</DELIVERY_DATE>

Pro zachování zpětné kompatibility bude nicméně element AVAILABILITY stále zpracováván. jak dlouho, to Seznam neuvádí. Cituji z informace, kteou jsem dostal na dotaz od podpory: „Datum ukončení podpory původního formátu XML feedu není stanoveno. Pokud by k jeho stanovení došlo, uživatelé budou informováni buď e-mailem, nebo uvedením této informace v nápovědě.“

Další změnou je i v elementu PRODUCT. Bude nepovinný, pokud však budou uvedeny elementy PRODUCTNAME a PRODUCTNAMEEXT. Element se požívá tam, kde ja název výrobku přímo vztažen k jednotlivému obchodu.

PRODUCTNAME by měl být krátký název výrobku včetně značky, bez přívlastků a parametrů (). Tento element se používá při zakládání nových výrobků do databáze, tj. jde o společné pojmenování jednoho výrobku od různých obchodů. Nesmí obsahovat žádné prvky, které by byly specifické jen pro daný obchod. Osobně to chápu tak, že správně je „Nikon D100“. Chcte-li uvést rozšižující název, tedy „Digitální zrcadlovka Nikon D100 + datový kabel“, poslouží vám k tomu element PRODUCTNAMEEXT. Rozšířující element PRODUCTNAME totiž doplňuje název o další upřesňující přívlastky a parametry. Nemizí samozřejmě popis výrobk, který se i nadále uvádí v elementu DESCRIPTION.

Další nové parametry, které známe z výstupu například pro Heuréku, je element MANUFACTURER. Je nepovinný a vyznačuje název výrobce produktu (Nikon). Opět po vzoru heuréky přibyl parametr CATEGORYTEXT. Je také nepovinný a specifikuje zařazení produktu do kategorie, ¨přičemž je nezbytné vždy uvádět celou cestu k produktu. Takže v našem případě „Foto/kino | Digitální fotoaparáty | Digitální zrcadlovky“. Protože výrobek můžete mít zalistovaný ve více kategoriích, element CATEGORYTEXT lze multiplikovat, opakovat ho. Pak bude zápis vypadat následovně:

<CATEGORYTEXT>Foto/kino | Digitální fotoaparáty | Digitální zrcadlovky</CATEGORYTEXT>

<CATEGORYTEXT>Foto/kino | Digitální fotoaparáty | Poloprofesionní fotoaparáty</CATEGORYTEXT>

Preferovaný oddělovač je znak “ | „, lze ale použít i znaky “ – “ nebo “ > „. V případě ostré závorky je třeba použít HTML entitu.

Nový element je i VARIANT (nepovinný), který upřesňuje různé varianty produktů. Například různé barvy, velikosti, vůně, příchutě atd. Prvek VARIANT je uvnitř elementu SHOPITEM a zároveň může obsahovat stejné elementy jako SHOPITEM (všechny jsou nepovinné). Varianta produktu se chápe jako samostatný produkt, potřebná data se načtou nejprve ze samotného elementu VARIANT, pokud tam nejsou, tak se načtou (zdědí) z vnějšího elementu SHOPITEM. V okamžiku, kdy je uveden jeden element VARIANT, tak je výsledkem jeden produkt. V aplikaci se budou zobrazovat jak jednotlivé varianty, tak i celá skupina. Za název skupiny je považován jen element PRODUCTNAME v rodičovském elementu SHOPITEM. U samotných variant není vyžadována jedinečná hodnota elementu URL, je ale nutné zajistit jedinečnost kombinace URL, PRODUCTNAME a PRODUCTNAMEEXT.

Ti, kdo používají kódy jako EAN nebo ISBN mohou uvídět i tato označení výrobku. EAN má vlastní element, jde o typ EAN13, musí se jednat o validní kód včetně kontrolní číslice, element je možné opakovat. Pro knihkupce je možno využít element PRODUCTNO, který v soubě skrývá  kód výrobku udávaný výrobcem, tedy ne vlastní kódy výrobků. Opět jde o způsob jak umožnit srovnávat stejné zboží od různých prodejců. Element je nepovinný.

Ukázkový XML výstup:

<?xml version=“1.0″ encoding=“UTF-8″?>

<SHOP>

<SHOPITEM>

<PRODUCTNAME>Nikon D100</PRODUCTNAME>

<PRODUCTNAMEEXT>Digitální zrcadlovka Nikon D100 + datový kabel zdarma</PRODUCTNAMEEXT>

<DESCRIPTION>Poloprofesionální digitální zrcadlovka s výměnnými objektivy z dílny Nikonu se představila na trhu poprvé v roce 2002. Od té doby se stala nenahraditelnou pomůckou jak amatérů fotografů, tak nenáročných profesionálů.</DESCRIPTION>

<MANUFACTURER>Nikon</MANUFACTURER>

<CATEGORYTEXT>Fotoaparáty | Digitální fotoaparáty | Digitální zrcadlovky</CATEGORYTEXT>

<CATEGORYTEXT>Fotoaparáty | Digitální fotoaparáty | Poloprofesionní fotoaparáty</CATEGORYTEXT>

<EAN>018208047871</EAN>

<PRODUCTNO>D33457220RRE</PRODUCTNO>

<URL>http://efotograf.cz/zrcadlovky/nikon-D100.html</URL>

<ITEM_TYPE>new</ITEM_TYPE>

<DELIVERY_DATE>0</DELIVERY_DATE>

<IMGURL>http://efotograf.cz/obrazky/nikon-D100.jpg</IMGURL>

<PRICE>7000</PRICE>

<PRICE_VAT>8330</PRICE_VAT>

<VARIANT>

<PRODUCTNAME>Nikon D100</PRODUCTNAME>

<PRODUCTNAMEEXT>Digitální zrcadlovka Nikon D100 – speciální edice<PRODUCTNAMEEXT>

<DESCRIPTION>Speciální edice poloprofesionální digitální zrcadlovky.</DESCRIPTION>

<EAN>018208047872</EAN>

<PRODUCTNO>D33457220RRS</PRODUCTNO>

<URL>http://efotograf.cz/zrcadlovky/nikon-D100-special.html</URL>

<ITEM_TYPE>new</ITEM_TYPE>

<DELIVERY_DATE>7</DELIVERY_DATE>

<IMGURL>http://efotograf.cz/obrazky/nikon-D100-special.jpg</IMGURL>

<PRICE>10000</PRICE>

<PRICE_VAT>11900</PRICE_VAT>

</VARIANT>

<VARIANT>

<PRODUCTNAME>Nikon D100</PRODUCTNAME>

<PRODUCTNAMEEXT>Digitální zrcadlovka Nikon D100 – silver body<PRODUCTNAMEEXT>

<DESCRIPTION>Poloprofesionální digitální zrcadlovky v atraktivní stříbrné úpravě.</DESCRIPTION>

<EAN>018208047873</EAN>

<PRODUCTNO>D33457220RRW</PRODUCTNO>

<URL>http://efotograf.cz/zrcadlovky/nikon-D100-silver.html</URL>

<ITEM_TYPE>new</ITEM_TYPE>

<DELIVERY_DATE>7</DELIVERY_DATE>

<IMGURL>http://efotograf.cz/obrazky/nikon-D100-silver.jpg</IMGURL>

<PRICE>8000</PRICE>

<PRICE_VAT>9520</PRICE_VAT>

</VARIANT>

</SHOPITEM>

<SHOPITEM>

</SHOPITEM>

</SHOP>

7 thoughts on “Nový formát XML výstupu pro Zboží.cz (XML feed)

  • Pingback: XML feed pro zbozi.cz | Open Cart Know How

  • avatar
    26. 7. 2010 at 19:48
    Permalink

    oprava – jen tagy PRODUCTNAMEEXT

    Reply
  • avatar
    26. 7. 2010 at 19:47
    Permalink

    tagy nemaj ukončovací tag , ale zase otevírací…

    Reply
  • avatar
    15. 9. 2009 at 10:38
    Permalink

    Samozřejmě jsem chtěl napsat &gt;, místo > 🙂

    Reply
  • avatar
    15. 9. 2009 at 10:33
    Permalink

    > je XML entita. Že je v HTML také je zde irelevatní, bavíme se o XML exportu. Naopak, ne aby vás napadlo použít v XML jakoukoliv HTML entitu; jiné než quot, amp, apos, lt a gt nejsou definovány (můžete použít číselný zápis). Vůbec by uživatelé udělali nejlépe, aby nepsali > když chtějí zapsat ostrou závorku, ale aby použili nějakou knihovnu, která zaručí validní (nebo alespoň well-styled) XML výstup (lze to i v PHP).

    Reply

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *