Naviguez ici et searchz "Télécharger toutes les participations" et vous arriverez au lien vers le file que je veux gratter (les en-têtes et le contenu des cellules).
L'utilisation de open-uri ou Roo renvoie la source de la page lorsque je passe dans le lien de la table (pas le contenu de la table).
En utilisant Ruby, comment puis-je lire le contenu de ce file? J'aimerais idéalement extraire le contenu et save le file original en format lecture seule.
Remarque: J'utilise déjà Mechanize / Nokogiri pour gratter et je souhaite compléter / valider mon grattage avec des files Excel liés comme ceux ci-dessus.
Assurez-vous d'utiliser Roo::Spreadsheet
and not Roo::Excelx
, car seule Roo::Spreadsheet
peut ouvrir directement des URL distantes:
url = 'https://www.spdrs.com/site-content/xls/TOTL_All_Holdings.xls?fund=TOTL&docname=All+Holdings&onyx_code1=1286&onyx_code2=' sheet = Roo::Spreadsheet.open(url)