Récupérer une « page internet ».

Le contenu et le contenant

 

Tâchons de simplifier!

Une page « internet » c’est une page éditée au format .html, et qui est « hebergée » et  « distribuée » par un serveur « web » elle est souvent accompagnée d’autres pages, afin d’avoir du contenu, et une autre qui sert à orchestrer le tout c’est le CSS pour le style: le contenant.

Prenons une page simple: www.cv.ordinatous.com

Celle-ci; éditée en HTML/CSS ne possède que peu d’image et d’icone. En faisant un clic-droit sur la page, un menu contextuel s’ouvre, dans lequel vous trouverez une série d’option, en particulier le « view page source ».

02récupérer-html

View page source

Petite explication, nos navigateurs internet, comme FireFox ou Chrome, Chromium, Konqueror, sont des lecteurs. Leur travail consiste en parti à lire des fichiers édités en HTML. Ils commencent avec l’en tête dans lequel se trouve divers information, qui lui sont uniquement destiné et invisible pour l’utilisateur. Le message à destination de l’utilisateur commence réellement à partir de la balise:

<div id= »container » >Ludovic MARCHAL</div>  qui est dans notre cas le titre, arrive ensuite un autre texte qui est un titre de niveau 2, contenu dans les balises, <h2></h2>.

03récupérer-html

Maintenant que vous avez la page source vous pouvez parfaitement l’enregistrer localement sur votre machine, afin d’y apporter des modifications. Pour cela j’utilise Bluefish, que j’apprécie beaucoup, Notepad++, très bien également, et enfin celui que j’ai découvert récemment Sublime Text, vraiment génial avec des fonctions vraiment avancé, très efficace lorsque l’on maitrise déjà bien le HTML.

 

 

Sidebar