KOI   WIN   LAT

Kak ustroen etot sajt (dlja web-programmistov)

Kazhdaja stranichka etogo sajta nahoditsja v otdel'noj direktorii, v URL imja fajla ne ukazyvaetsja (naprimer URL etoj stranichki http://lena.kiev.ua/guts/ ). Blagodarja etomu stranichki indeksirujutsja vsemi poiskovikami (search engines), v tom chisle temi, kotorye "ne ljubjat" CGI-skripty (naprimer aport.ru ne indeksiruet stranichki .cgi i .pl), hotja na samom dele stranichki etogo sajta vydajutsja CGI-skriptami (SSI ne ispol'zuetsja), v kazhdoj direktorii est' fajl index.pl . Posmotrite kopiju fajla /guts/index.pl - nastojaschego ishodnogo teksta etoj stranichki (on lezhit na webserver-e v kodirovke koi8-r) i vyzyvaemyj iz nego skript /rct (Perl), obespechivajuschij perekodirovanie (windows-1251, koi8-r, translit), schetchiki, webtracker, blokirovanie nekotoryh spambotov (email address harvesters). Webserver Apache pod Linux, bez russkogo Apache. V direktorii /tracker/ nakaplivaetsja log tracker-a, on avtomaticheski vysylaetsja mne pochtoj ezhednevno (pri pervom poseschenii sajta posle polunochi GMT), prichem cron dlja etogo ne nuzhen. Zaderzhki pri opredelenii imen domenov i strany po IP-adresam posetitelja i pri otsylke loga pochtoj sovershenno ne skazyvajutsja na vremeni vydachi stranichki posetitelju: snachala webserver zakanchivaet vydachu stranichki browser-u posetitelja, i tol'ko posle etogo nachinaetsja rabota webtracker-a. V loge webtracker-a (po stroke na kazhdoe poseschenie stranichki) fiksirujutsja:

Tekst kazhdogo iz fajlov index.pl poluchen iz obychnogo ishodnogo teksta HTML zamenoj kazhdogo simvola \ na dva simvola \\, zatem @ na \@, $ na \$, dobavleniem dvuh strok v nachale i dvuh strok v konce i vstavkoj v sootvetstvujuschih mestah imen peremennyh, sozdannyh skriptom rct:

V kornevoj direktorii sajta krome fajlov index.pl (ishodnyj tekst kornevoj stranichki sajta) i rct ja sozdala takzhe poddirektorii /tracker/ i /counters/ (v nej skript rct avtomaticheski sozdaet fajly schetchikov - po fajlu dlinoj 8 bajt na kazhduju stranichku) i fajl .htaccess takogo soderzhanija:

DirectoryIndex index.pl
Options +ExecCGI
Fajlu index.pl v kazhdoj direktorii sdelan chmod 755. Fajlu /rct ne nuzhno delat' chmod.

JA pol'zovalas' v osnovnom dostupom k Internetu cherez email, v tom chisle vygruzhala fajly na webserver ispol'zuja sozdannye mnoju zhe servery mail->FTP. Moj pochtovyj klient otpravljal pis'ma v kodirovke koi8-r, imenno poetomu fajly stranichek i skript lezhat na webserver-e v kodirovke koi8-r - mne tak udobnee. :) A sejchas na moem domashnem komp'jutere ja pol'zujus' operacionnoj sistemoj FreeBSD, i fajly v nem tozhe v kodirovke koi8-r.

Vydavaemye webserver-om (Apache) skriptam peremennye okruzhenija ja posmotrela s pomosch'ju skriptika:

#!/usr/bin/perl
print "Content-type: text/plain\n\n";
foreach ( sort keys %ENV ) { print "$_ = $ENV{$_}\n"; }

Snachala ja skopirovala fajl robots.txt v kornevuju direktoriju moego sajta s http://groups.yahoo.com/robots.txt - on koroche, chem stranichka s soobscheniem 404 page not found, eto nemnozhko umen'shaet traffik (pri tom zhe kolichestve poseschenij). Bolee suschestvenna dlja umen'shenija traffika (i uskorenija povtornoj zagruzki stranichek) chast' skripta rct, vydajuschaja Last-Modified. Pozzhe ja zamenila robots.txt na rekomendovannyj v http://alicorna.com/techtips.html.

Naschet HTML - ja ishodila v pervuju ochered' iz principov "Best viewed with any browser" i "KISS" (Keep It Simple, Stupid). Dizajn "rezinovyj", pri ljubom razreshenii nachinaja s 640x480 zapolnjaet vsju ploschad' ekrana, no bez prokrutki vlevo-vpravo, dlja etogo zhe bez frames. Nu ne ljublju ja neopravdannye navoroty, ne sleduju komp'juternoj mode.

Mne interesny vashi zamechanija i otzyvy. Moj email adres - na kornevoj stranichke etogo sajta.

K etoj stranichke bylo 35977 obraschenij s 19 marta 2003.
Poslednie izmenenija vneseny 1 janvarja 2023.
This page has been accessed 35977 times since March 19, 2003.
Last updated on January 1, 2023.