Kirjautuminen

Haku

Tehtävät

Keskustelu: Projektit: Findsubs

Sivun loppuun

Codeclown [16.10.2011 19:28:47]

#

Morjens!

Pitkästä aikaa tänne kurkatessani huomasin tämänkin alueen. Mainoksen ja palautteen perässä postaan tämän projektin, joka on valmiina ollut jonkin aikaa, ehkä pari kuukautta.

Kyseessä on hakukone tekstityksille. Kaikki varmasti tuntevat Subsearchin (on niitä muitakin, ei tosin tietääkseni suomalaisia) ja ajattelevat nyt mielessään että tylsä kopioitu idea. Miksi tein uuden hakukoneen?

Digitaalisten leffojen harrastajana haen paljon tekstityksiä elokuviin. Kyllästyin Subsearchin runsaaseen ulkoasuun sekä jatkuvaan linkkien päälle sohimiseen julkaisunimien toivossa. En täysin hauku Subsearchia, mutta koin tarvetta olevan erilaiselle vaihtoehdolle.

Pikkuhiljaa aloitin oman hakukoneen, joka aluksi haki tekstejä suoraan sivustojen rajapinnoista, siis ilman omaa tietokantaa. Nopeasti tuli kuitenkin huomattua, ettei tämä ole järkevä vaihtoehto. Väsäsin seuraavaksi PHP:lla cron jobit, jotka hakevat sivustojen tietokannat Findsubsin omaan tietokantaan päivittäin. Pistin ranttaliksi ja tein cronit seuraavaksi Pythonilla, joka on optimaalisempi jättimäisten (kymmeniä tuhansia) tekstitysmäärien käsittelyssä. Samalla tuli opittua Pythonia.

Ulkoasun pyrin pitämään mahdollisimman kirjasto-tyyppisenä, jos tajuatte mitä tarkoitan. Ei siis silmille karkkia, vaan avoin simppeli kirjasto, josta löytää juuri sen mitä hakee.

Mikä tämän hyöty nyt sitten on? Oletetaan, että käyttäjä etsii suomenkielisiä subeja leffaan The Dark Knight:

http://findsubs.org/#/search/m:dark+knight/r:/l:fi

"The"-sanaa ei kannata turhaan kirjoittaa, se napataan pois kuitenkin. Tuloksena lista subeista. Nyt alkaa hauskuus. Oletetaan, että käyttäjä on (laillisia keinoja käyttäen) saanut haltuunsa leffasta aXXo-julkaisun:

http://findsubs.org/#/search/m:dark+knight/r:axxo/l:fi

Findsubs karsii tuloksista pois kaikki, joiden releasename ei sisällä pyydettyä tekstiä. Tietyn julkaisun oikeat subit löytyvät hetkessä.

Yksi ongelma tuli vastaan, nimittäin elokuvien sekä sarjojen nimet sivustojen tietokannoissa. Silloin tällöin esimerkiksi TV-sarjan subit oli nimitetty tyyliin "The Big Bang Theory Season 1 Episode 6". Kaikki vastaavat "muodot", jotka löysin, on laitettu muuntumaan muotoon "The Big Bang Theory S01 E06", mutta mahdollista on, että nimissä on silti jotain häikkää.

Mielipiteitä otetaan vastaan. Systeemi on oikeastaan valmis, joten muutoksia ei varmastikaan tule, mutta jos joku ehdottaa jotakin todella hyödyllistä, mahdollisesti innostun lisäilemään =)

Jos kiinnostaa, Findsubsissa vierailee päivittäin ~5-10 satunnaista kävijää, pääosin Suomesta ja Ameriikoista.

Todo: Vuoden perusteella hakeminen. Muuta?

Pessi [16.10.2011 20:38:09]

#

Ah vihdoin parannus tuohon julkaisunimen esiin sohimisessa. Mitä tulee tuohon suodatukseen niin kyllä sama onnistuu Subsearchissa kun vain kirjoittaa julkaisijan mukaan hakuun. Suodatuksessa on vielä sellainen bugi ettei se löydä kaikkia julkaisuja. Taitaa johtua siitä että samassa paketissa on useamman julkaisun subit.

http://findsubs.org/#/search/m:dark knight/r:axxo/l:fi
http://subsearch.org/Dark knight axxo/fi/4/0/0
Siinä vielä esimerkiksi. DivX Finlandin subit puuttuu tuloksista. Ilman julkaisijaa kun hakee niin DivX Finlandin paketti löytyy mutta julkaisijana on vain The Dark knight.

Codeclown [16.10.2011 21:23:17]

#

Pessi kirjoitti:

Ilman julkaisijaa kun hakee niin DivX Finlandin paketti löytyy mutta julkaisijana on vain The Dark knight.

Jep, johtuu nimenomaan siitä, että DivX Finlandilla subit samassa paketissa. Tämän voisi kyllä ratkaista, kiitos huomautuksesta!

jcd3nton [17.10.2011 02:32:37]

#

Subsearch toimii ilman javascriptia. Taidan siis jatkossakin kayttaa sita.

Codeclown [17.10.2011 08:09:44]

#

jcd3nton kirjoitti:

Subsearch toimii ilman javascriptia. Taidan siis jatkossakin kayttaa sita.

Oletan siis että selaimessasi on JavaScript pois päältä? Tästä voisi puhua enemmänkin, mutta sanon sen verran että JS on päällä valtaosassa selaimista (valtaosa = yli 95%) ja sen käytöstä poistaminen on käyttäjän oma valinta. Nykyään webbisivuissa on jo paljon JavaScriptiin pohjautuvaa sisältöä sun muuta härpäkettä, mutta en muista pitkiin aikoihin törmänneeni JavaScriptin ylikäyttöön (kuten turhiin nappeihin tai pop-uppeihin) eikä mieleeni tule yhtään syytä, miksen JavaScriptiä päällä pitäisi.

Näkeekö Subsearchissa julkaisunimet jostain ilman JavaScriptiä? Sorsasta tietty ainakin :3

Lebe80 [17.10.2011 11:17:37]

#

Toteutustavan ansiosta selaimen normaali back-nappi ei toimi Chromessa.

Tämän vuoksi esim. About & Terms-sivustolle siirryttäessä ei pääse takaisin hakuosioon.

jcd3nton [17.10.2011 14:08:14]

#

Codeclown kirjoitti:

Oletan siis että selaimessasi on JavaScript pois päältä? Tästä voisi puhua enemmänkin, mutta sanon sen verran että JS on päällä valtaosassa selaimista (valtaosa = yli 95%) ja sen käytöstä poistaminen on käyttäjän oma valinta. Nykyään webbisivuissa on jo paljon JavaScriptiin pohjautuvaa sisältöä sun muuta härpäkettä, mutta en muista pitkiin aikoihin törmänneeni JavaScriptin ylikäyttöön (kuten turhiin nappeihin tai pop-uppeihin) eikä mieleeni tule yhtään syytä, miksen JavaScriptiä päällä pitäisi.

Selaimessani ei ole JavaScript-toteutusta. Minusta yksinkertaisen ja perinteisen hakutoiminnon toteuttaminen niin, ettei se toimi lainkaan ilman JavaScriptia, on juurikin sen turhaa ylikayttoa.

Lebe80 [17.10.2011 14:24:41]

#

JavaScriptin käytön hakutoiminnossa ymmärtäisin, jos sivuston haku toimisi automaattisesti sitä mukaan, kun käyttäjä kirjoittaa kirjaimia hakukenttään.

jcd3nton [17.10.2011 14:43:05]

#

Ja silloinkaan ei sen tarvitsisi olla toimimisen kannalta ehdoton ominaisuus; ilman JS:aa selaavat painavat mielihyvin itse nappulaa kirjoittamisen paatteeksi.

Codeclown [17.10.2011 17:07:10]

#

Lebe80 kirjoitti:

Toteutustavan ansiosta selaimen normaali back-nappi ei toimi Chromessa.

Hyvä huomio, en ole tullut ajatelleeksi. Kiitos tästä :)

jcd3nton kirjoitti:

Minusta yksinkertaisen ja perinteisen hakutoiminnon toteuttaminen niin, ettei se toimi lainkaan ilman JavaScriptia, on juurikin sen turhaa ylikayttoa.

Idea Findsubsin takana on nimenomaan nopeus (ja avoimuus). Toki JS-vajaa versio olisi mahdollinen, mutta kuten jo sanottu, valtaosa selaajista ei ole JS:stä moksiskaan ja muutenkin webin kehittyessä käyttäjät vaativat sujuvampaa käyttöliittymää.

Lebe80 kirjoitti:

JavaScriptin käytön hakutoiminnossa ymmärtäisin, jos sivuston haku toimisi automaattisesti sitä mukaan, kun käyttäjä kirjoittaa kirjaimia hakukenttään.

Itse olen ihmetellyt sitä, miksi esimerkiksi Google näin tekee, sillä omalla kohdallani en ole huomannut ajan säästyvän; kirjoitan joka tapauksessa sen mitä oli alunperin aikomus ja painan entteriä. Voi tosin olla, että vähemmän tietokonetta käyttävät kokevat tämän hyvänä ominaisuutena, sillä haettu sivu saattaa pompata esiin etukäteen eikä lopputekstiä tarvitse yhdellä sormella näpytellä. Findsubsin käyttäjäkunta on kuitenkin sitä aktiivisemmin tietokonetta käyttävää porukkaa.

Grez [17.10.2011 17:19:34]

#

Codeclown kirjoitti:

Itse olen ihmetellyt sitä, miksi esimerkiksi Google näin tekee, sillä omalla kohdallani en ole huomannut ajan säästyvän; kirjoitan joka tapauksessa sen mitä oli alunperin aikomus ja painan entteriä.

Eli siis et osaa käyttää palvelua tehokkaasti?

No riippuu toki kuinka pitkiä hakuja yleensä kirjoitat että kuinka paljon tuosta on hyötyä.

Itse kun katson kuitenkin näyttöä kun kirjoitan, niin silloin tällöin pidempää hakua kirjoittaessa tulee huomattua vastauksen jo löytyneen ennenkuin pääsen loppuun asti.

jcd3nton [17.10.2011 17:38:11]

#

Codeclown kirjoitti:

Toki JS-vajaa versio olisi mahdollinen, mutta kuten jo sanottu, valtaosa selaajista ei ole JS:stä moksiskaan ja muutenkin webin kehittyessä käyttäjät vaativat sujuvampaa käyttöliittymää.

Minun kohdallani kayttoliittyma on selain. "Sivu" on sisalto. Selaimen ominaisuudet maarittavat kayttoliityman sujuvuuden, ja voin muokata sen itselleni parhaiten sopivaksi.

Toteuttamalla sivuston kriittiset ominaisuudet yksinomaan JavaScriptilla voit estaa selainta toimimasta niin kuin se ymparistossaan parhaiten toimii. Voit vaittaa tekevasi kayttoliittymasta sujuvamman, jos kuvittelet tietavasi miten ja millaisessa ymparistossa kayttajasi ovat tottuneet selaamaan. Mutta miksi sivun ylipaansa pitaisi tarjota kayttoliittymaa? Miksi ei riita, etta selain tarjoaa kayttoliittyman ja sivu sisallon?

Ehkapa mina en sitten ole webin kayttaja.

Edit. Ei sivusta edes tarvitse tehda useaa eri versiota. Perustoiminnallisuuden voi rakentaa staattisella HTML:lla, jota JavaScript sitten taydentaa jos kayttaja sen sallii.

Codeclown [17.10.2011 17:56:21]

#

Toivoin palautetta suoraan liittyen Findsubsiin mutta hienoa sentään että edes keskustelua syntyy.

Grez kirjoitti:

Eli siis et osaa käyttää palvelua tehokkaasti?

Kirjoitan itse sen verran nopeasti, että olen saanut koko tekstin kirjoitettua, ennen kuin Googlen automaattiset tulokset ehtivät latautua. Mielestäni olisi hölmöä odottaa tulosten automaattista näkymistä siinä toivossa, että ne vastaavat täyttä hakua sen sijaan, että kirjoittaa koko tekstin samalla kertaa ja painaa entteriä, eikä haku jää vajaaksi. Ennenkuin kukaan siihen takertuu, huomautan vielä että sanoin jo edellisessä viestissäni tästä ominaisuudesta kuitenkin mahdollisesti olevan hyötyä jollekin kohderyhmälle.

Nyt on pakko huomauttaa, että kirjoittaessani tätä viestiä päivitti Putkan systeemi näkyviin jcd:n uusimman viestin, jota en olisi muuten huomannut. Propsit tekijöille hyvästä JavaScriptin käytöstä =D

jcd3nton kirjoitti:

Minun kohdallani kayttoliittyma on selain. "Sivu" on sisalto. Selaimen ominaisuudet maarittavat kayttoliityman sujuvuuden, ja voin muokata sen itselleni parhaiten sopivaksi.

Ei ole tarkoitus hyökätä täysin vastaan, mutta nykyaikana ja varsinkin tulevaisuudessa webbi on *the* alusta. On itsestään selvää, että sivusto on käyttöliittymä, jos nyt puhumme yleensäkin samasta asiasta; käyttöliittymä on paikka, jossa tapahtuu ihmisen ja systeemin vuorovaikutusta. On myös itsestään selvää, ettei selain "täydennä" sivustoa, vaan pikemminkin päinvastoin; sivusto pyrkii luomaan mahdollisimman sopivan ympäristön, jonka selain toimittaa käyttäjälle.

jcd3nton kirjoitti:

Toteuttamalla sivuston kriittiset ominaisuudet yksinomaan JavaScriptilla voit estaa selainta toimimasta niin kuin se ymparistossaan parhaiten toimii. Voit vaittaa tekevasi kayttoliittymasta sujuvamman, jos kuvittelet tietavasi miten ja millaisessa ymparistossa kayttajasi ovat tottuneet selaamaan. Mutta miksi sivun ylipaansa pitaisi tarjota kayttoliittymaa? Miksi ei riita, etta selain tarjoaa kayttoliittyman ja sivu sisallon?

Olen hieman hämilläni viestisi sisällöstä. Tähän vastasin jo edellä.

jcd3nton kirjoitti:

Ehkapa mina en sitten ole webin kayttaja.

Tämän kaltainen retoriikka kuuluu ylä-asteelle. No offense. Ei tässä kukaan absoluuttisia totuuksia jakele, enkä odota että hyväksyt mielipiteeni siltä seisomalta. Toivon silti että pysytään asiallisessa kirjoittelussa.

jcd3nton kirjoitti:

Edit. Ei sivusta edes tarvitse tehda useaa eri versiota. Perustoiminnallisuuden voi rakentaa staattisella HTML:lla, jota JavaScript sitten taydentaa jos kayttaja sen sallii.

Ymmärrän, että sivuston kriittiset ominaisuudet tulisi saada käyttöönsä mahdollisimman helposti. Silti, JS on tätä pääosin helpottava tekijä. Siinä missä 2% kävijöistä ei palvelua voi käyttää oman selainvalintansa seurauksena, 98% käyttäjistä saa palvelun käyttöönsä käyttäjäystävällisempänä. Kaikkia on mahdoton miellyttää.

Mizou [17.10.2011 18:19:39]

#

Codeclown kirjoitti:

Ymmärrän, että sivuston kriittiset ominaisuudet tulisi saada käyttöönsä mahdollisimman helposti. Silti, JS on tätä pääosin helpottava tekijä. Siinä missä 2% kävijöistä ei palvelua voi käyttää oman selainvalintansa seurauksena, 98% käyttäjistä saa palvelun käyttöönsä käyttäjäystävällisempänä. Kaikkia on mahdoton miellyttää.

Mutta tässä tapauksessa kaikkia on mahdollista miellyttää?

Ensinnäkään kaikki eivät voi välttämättä vaikuttaa selainvalintaansa, toiseksi miten se on pois tuolta 98% jos lopuille tarjotaan vähemmän "käyttäjäystävällinen" vaihtoehto. Yleisestikkin oma mielikuva sivujen tekemisestä on se että ensin tehdään perustoiminnallisuus jota sitten parannetaan vaikka Javascriptillä.

Metabolix [17.10.2011 18:19:53]

#

Codeclown kirjoitti:

Kaikkia on mahdoton miellyttää.

Jos olet tästä nimenomaisesta JS-kysymyksest tuota mieltä, on ainoa mieleen tuleva johtopäätös se, että taitaapi olla HTML- ja JS-taidoissasi vakavia puutteita. Ei todellakaan ole iso työ tehdä sivua niin, että HTML muodostaa mielekkään kokonaisuuden ja JS-toiminnot lisätään päälle dynaamisesti. Jos systeemisi on alkuunkaan järkevästi suunniteltu, ylimääräistä työtä tulisi vain sen verran, kuin HTML:n tuottaminen palvelinpuolella aiheuttaa. (Usein JS-puolenkin sisältö palautetaan valmiiksi HTML-muotoisena, jolloin sitäkään ylimääräistä vaivaa ei juuri ole.) Käytännön esimerkkejä ratkaisun toimivuudesta ovat vaikkapa Google ja Ohjelmointiputka.

Mizou kirjoitti:

Ensinnäkään kaikki eivät voi välttämättä vaikuttaa selainvalintaansa

Ymmärrän argumentin jonkin työpaikan tai yliopiston IE:n suhteen, mutta jotenkin on vaikea keksiä tilannetta, jossa Links 2 tai w3m olisi teknisesti todella ainoa vaihtoehto. :)

Codeclown kirjoitti:

Pistin ranttaliksi ja tein cronit seuraavaksi Pythonilla, joka on optimaalisempi jättimäisten (kymmeniä tuhansia) tekstitysmäärien käsittelyssä.

Näinkö on? Millaisia mittaustuloksia suunnilleen sait?

Codeclown [17.10.2011 18:51:57]

#

Metabolix kirjoitti:

Jos olet tästä nimenomaisesta JS-kysymyksest tuota mieltä, on ainoa mieleen tuleva johtopäätös se, että taitaapi olla HTML- ja JS-taidoissasi vakavia puutteita. Ei todellakaan ole iso työ tehdä sivua niin, että HTML muodostaa mielekkään kokonaisuuden ja JS-toiminnot lisätään päälle dynaamisesti. Jos systeemisi on alkuunkaan järkevästi suunniteltu, ylimääräistä työtä tulisi vain sen verran, kuin HTML:n tuottaminen palvelinpuolella aiheuttaa. (Usein JS-puolenkin sisältö palautetaan valmiiksi HTML-muotoisena, jolloin sitäkään ylimääräistä vaivaa ei juuri ole.) Käytännön esimerkkejä ratkaisun toimivuudesta ovat vaikkapa Google ja Ohjelmointiputka.

Findsubsin back-end palauttaa tulokset muodossa json, mikä oli tietoinen valinta erottaessa front-endiä ja back-endiä (takaa myös laajennettavuuden, vie tosin resursseja käyttäjältä kun selain muotoilee tulokset). Olet oikeassa siinä, ettei Findsubsin muuntaminen myös ilman JavaScriptiä toimivaksi vaadi järin suurta vaivaa. Tässä kirjoitellessa olen jo oikeastaan kiinnostunut ajatuksesta ja saa nähdä, tuleeko toteutumaan.

Uskon silti ettei JavaScriptiä kannata pelätä, ja että on käyttäjästä itsestään kiinni, pitääkö päällä vai ei. En kyllä näe syytä olla pitämättä.

Metabolix kirjoitti:

Näinkö on? Millaisia mittaustuloksia suunnilleen sait?

Luulen tietäväni mitä ajat takaa. Tilastoja ei ole tarjota, mutta kävi selväksi, että PHP:n rajallinen muisti aiheutti ongelmia -> cronit veivät juostessaan koko PHP:n jumiin, mikä tietysti hidastaa samanaikaisia käyttäjien tekemiä hakuja. Vieläkin cronien ajaessa on huomattavissa *erittäin* lievää hitautta, johtuen cronin tietokanta-floodauksesta. Ensiajon jälkeen cronien suoritus kestää kuitenkin vain joitakin minuutteja.

jcd3nton [17.10.2011 22:22:02]

#

Metabolix kirjoitti:

Mizou kirjoitti:

Ensinnäkään kaikki eivät voi välttämättä vaikuttaa selainvalintaansa

Ymmärrän argumentin jonkin työpaikan tai yliopiston IE:n suhteen, mutta jotenkin on vaikea keksiä tilannetta, jossa Links 2 tai w3m olisi teknisesti todella ainoa vaihtoehto. :)

Vai niin. Kuinka moni nykyselaimista toimii moitteetta vaikkapa MIPS64:lla? Oletko kokeillut? Voit toki kehottaa ostamaan yleisen prosessorin ja vaihtamaan Pyhan Valtavirran hyvaksymaan kayttojarjestelmaan, mutta jotakuinkin samoilla argumenteilla voidaan tyopaikalle tai yliopistolle kantaa oma tietokone -- tai ainakin oma USB-tikku, jolta loytyy sopivaa softaa. Mutta enta jos vaihtoehdot eivat miellyta alkuunkaan?

Toistaiseksi omat syyni selainvalintaan eivat ole niinkaan teknisia. Raskaiden "modernien" selainten kayttokokemus vaan sattu olemaan suolesta. Esim. Firefoxin kayttoliittyman saa melkein siedettavaksi Vimperatorilla, mutta senkin kanssa erityisesti JavaScriptia kayttavat sivut onnistuvat sotkemaan kuviot turhalla interaktiivisuudella ja nappaimenpainalluksien & fokuksen kanssa pelleilylla. Vimperator ei valitettavasti korjaa selaimen tietoturvaongelmia, raskautta, kuvasekamelskaa, tai inhottavaa muotoilua. Miksipa en kayttaisi selainta, joka suoriltaan toimii jotakuinkin mukavasti? :-)

Metabolix [17.10.2011 22:58:19]

#

Codeclown kirjoitti:

Findsubsin back-end palauttaa tulokset muodossa json, mikä oli tietoinen valinta erottaessa front-endiä ja back-endiä

Huomasin tämän. Minusta on hieman pelleilyä palauttaa tulokset tuollaisessa muodossa, kun kuitenkin mm. listan järjestäminen nähtävästi tapahtuu palvelinpuolella ja aiheuttaa siis turhan HTTP-pyynnön.

Codeclown kirjoitti:

Metabolix kirjoitti:

Näinkö on [Python nopeampi kuin PHP]? Millaisia mittaustuloksia suunnilleen sait?

Luulen tietäväni mitä ajat takaa. Tilastoja ei ole tarjota, mutta kävi selväksi, että PHP:n rajallinen muisti aiheutti ongelmia -> cronit veivät juostessaan koko PHP:n jumiin – –

Tarkoitus ei ollut olla sarkastinen, vaan olisin kiinnostunut todellisista mittauseroista, kun oman käsitykseni mukaan PHP ei ole mitenkään poikkeuksellisen hidas eikä varsinkaan Python erityisen nopea.

PHP:n muistirajaa voi säätää. Epäilen kuitenkin, ettei nopeusongelma vain sillä selity. Näinköhän edes algoritmisi pysyi aivan vertailukelpoisena?

jdc3nton kirjoitti:

Vai niin. Kuinka moni nykyselaimista toimii moitteetta vaikkapa MIPS64:lla?

Väitätkö, että joudut olosuhteiden pakosta käyttämään MIPS64-konetta? Tuskinpa, vaan kyseessä lienee oma päätöksesi, jonka tehdessäsi olet jo tiennyt, että vaihtoehdot tulevat olemaan toisenlaiset kuin "tavallisella" x86-64-koneella. Eli vaikka et enää voikaan paljon vaikuttaa selainvalintaasi, olet silti kaiketi aiheuttanut tilanteen itse.

jcd3nton [17.10.2011 23:08:58]

#

Metabolix kirjoitti:

Väitätkö, että joudut olosuhteiden pakosta käyttämään MIPS64-konetta? Tuskinpa, vaan kyseessä lienee oma päätöksesi, jonka tehdessäsi olet jo tiennyt, että vaihtoehdot tulevat olemaan toisenlaiset kuin "tavallisella" x86-64-koneella. Eli vaikka et enää voikaan paljon vaikuttaa selainvalintaasi, olet silti kaiketi aiheuttanut tilanteen itse.

Vaitan, etta olosuhteiden pakosta ei sen enempaa joudu kayttamaan IE6:ta kuin MIPS64:aakaan. Useimmiten voit itse vaikuttaa siihen mita on saatavilla. Mukavuusaspekti menee kuitenkin yleensa moisen vaikuttamisen edelle. Sinusta ei ehka ole mukavaa asentaa tai ajaa omaa softaa yliopiston tietokoneella (tai raahata omaa kannettavaa mukana). Minusta ei ehka ole mukavaa kayttaa softaa, joka kayttaytyy kurjasti.

Codeclown [18.10.2011 16:35:05]

#

Metabolix kirjoitti:

Huomasin tämän. Minusta on hieman pelleilyä palauttaa tulokset tuollaisessa muodossa, kun kuitenkin mm. listan järjestäminen nähtävästi tapahtuu palvelinpuolella ja aiheuttaa siis turhan HTTP-pyynnön.

Palvelin palauttaa vain sivullisen tuloksia kerrallaan, jottei turhaa dataa tarvitse siirtää. Tästä johtuen totta kai järjestäminen tapahtuu palvelinpuolella, muutenhan vain kyseisen sivun järjestys muuttuisi.

Metabolix kirjoitti:

PHP:n muistirajaa voi säätää. Epäilen kuitenkin, ettei nopeusongelma vain sillä selity. Näinköhän edes algoritmisi pysyi aivan vertailukelpoisena?

Pythoniin siirtyminen ei paljoa vaatinut, muunsin suoraan Pythoniksi seuraillen PHP-koodia. Molemmat koodit ovat siis toistensa kopioita. Koin järkeväksi siirtää cronit rasittamaan Pythonia PHP:n (joka toimittaa haun) sijaan.

Pythoniin siirtymällä myös muistirajan yletön nostaminen välttyi.

Codeclown [30.11.2011 10:58:32]

#

Sori tuplaposti.

---

Noniin, ajatus staattisesti toimivasta, mahdollisella JavaScriptillä höystetystä systeemistä kiehtoi sen verran, että toteutin. Muutakin tuli lisäiltyä. Toivon asiallista keskustelua aiheesta, risut ja ruusut otetaan vastaan.

Uusi versio on siis livenä osoitteessa http://findsubs.org

tuutti [30.11.2011 12:15:42]

#

Myös title vois linkata filuun, eikä pelkästää releasename.

Codeclown [30.11.2011 13:42:26]

#

tuutti kirjoitti:

Myös title vois linkata filuun, eikä pelkästää releasename.

Nyt title linkkaa myös.

Metabolix [02.12.2011 18:53:00]

#

Kaipaisin ainakin selvempää AJAX-indikaattoria. Nykyinen vaalennus on niin hento, että mietin, toimiko lomake enteristä ollenkaan, ja meinasin vielä varmuudeksi painaa hiirellä nappia. Tulosten ilmestyessä vasta huomasin muutoksen.

Kokeilemallani epämääräisellä haulla löytyi moniosaisen sarjan useita osia, jokaisesta pari sivua tuloksia. Ensimmäisellä sivulla näkyi tällöin tietysti vain aakkosissa ensin tulevan versioita, ja jouduin selaamaan sivuja tai tarkentamaan hakua. Tilannetta parantaisi, jos elokuvat tällaisessa tilanteissa olisivat puurakenteena: tietty elokuva esiintyisi puussa vain kerran, ja sitä klikkaamalla saisi listan eri julkaisuversioista.

Monet rivit ovat nyt myös tyylittömän korkeita, kun sekä elokuvan nimi että julkaisun nimi ovat välillä pitkiä (esim. silloin, kun "julkaisu" on muotoa Elokuva-X-DVDRip-2015-Foo) ja aiheuttavat tekstin katkeamisen kahdelle riville. Tähänkin voisi auttaa tuo ehdottamani puurakenne.

Codeclown [03.12.2011 12:14:40]

#

Metabolix kirjoitti:

Kaipaisin ainakin selvempää AJAX-indikaattoria. Nykyinen vaalennus on niin hento, että mietin, toimiko lomake enteristä ollenkaan, ja meinasin vielä varmuudeksi painaa hiirellä nappia. Tulosten ilmestyessä vasta huomasin muutoksen.

En osaa kuvitella tähän muuta kuin sen, että monitorisi asetukset (varmaankin kontrasti) ovat jotenkin pielessä. Omalla BenQ:lla ei ole epäilystäkään latauksesta, ja jopa läppärini näyttö, joka ei pärjää tässä testissä, näyttää vaalennuksen selvästi.

Metabolix kirjoitti:

Kokeilemallani epämääräisellä haulla löytyi moniosaisen sarjan useita osia, jokaisesta pari sivua tuloksia. Ensimmäisellä sivulla näkyi tällöin tietysti vain aakkosissa ensin tulevan versioita, ja jouduin selaamaan sivuja tai tarkentamaan hakua. Tilannetta parantaisi, jos elokuvat tällaisessa tilanteissa olisivat puurakenteena: tietty elokuva esiintyisi puussa vain kerran, ja sitä klikkaamalla saisi listan eri julkaisuversioista.

Ota huomioon Findsubsin kohdeyleisö. Subsearch on jo olemassa heille, jotka etsivät subeja. Findsubs on heille, jotka etsivät niitä *tiettyjä* subeja. Koko järjestelmän tarkoitushan on se, että hakua voi rajata. Puurakenne on muutenkin heikko ratkaisu, sillä valitettavan usein sivustojen API:t palauttavat elokuvien nimet typotettuna, mikä tuottaisi turhia oksia puuhun.

Metabolix kirjoitti:

Monet rivit ovat nyt myös tyylittömän korkeita, kun sekä elokuvan nimi että julkaisun nimi ovat välillä pitkiä (esim. silloin, kun "julkaisu" on muotoa Elokuva-X-DVDRip-2015-Foo) ja aiheuttavat tekstin katkeamisen kahdelle riville. Tähänkin voisi auttaa tuo ehdottamani puurakenne.

Tämä on todo-listalla. Vähintään 1000px leveillä näytöillä testanneena olen vain unohtanut koko ongelman. Jossain vaiheessa tulee päivitys, jonka jälkeen moniriviset tulokset muuntuvat 1-rivisiksi, ja hiirtä päälle työntämällä saa koko rivin näkyviin.

Metabolix [03.12.2011 12:50:10]

#

Codeclown kirjoitti:

En osaa kuvitella tähän muuta kuin sen, että monitorisi asetukset (varmaankin kontrasti) ovat jotenkin pielessä.

Asetukset ovat kyllä ihan kunnossa, kiitos kysymästä. En väittänyt, ettei muutos olisi sinänsä aivan näkyvä. En vain välttämättä tuijota ruutua silmä kovana juuri silloin, kun painan enteriä, joten mielessä ei ole välitöntä vertailukohtaa ennen ja jälkeen lähetyksen. Tietenkin nyt näen eron vaikka silmät kiinni, kun olen kiinnittänyt asiaan näin paljon huomiota, mutta nimenomaan aluksi en ollenkaan muistanut, oliko sivu tummempi ennen klikkausta – nimittäin jotkin sivut ovat normaalitilassa järjettömän vaaleita. Onneksi haku tuntuu yleensä toimivan niin nopeasti, että ei ole aikaa miettiä asiaa. Satuin ehkä vain huonoon aikaan paikalle, kun meni tosiaan useampi sekunti.

Codeclown kirjoitti:

Vähintään 1000px leveillä näytöillä testanneena olen vain unohtanut koko ongelman.

Selainikkunani on 1280x800 pikseliä.

Codeclown kirjoitti:

Ota huomioon Findsubsin kohdeyleisö. – – Findsubs on heille, jotka etsivät niitä *tiettyjä* subeja.

Eivätkö kaikki sitten etsi tiettyjä subeja? Yleensä on varmaankin elokuva jostain hankittuna ennen tekstejä. Kun jo elokuvan koko nimi on yli 50 merkkiä ja julkaisu ja vuosiluku vielä lisää, olisi aika toivottavaa, että naputtelusta voisi jotenkin luistaa ja saada silti hyvät tulokset helposti selattavassa muodossa. :) Ehdotteleva tekstinsyöttö olisi myös yksi apu tähän, jos kaistasi kestää.

Codeclown kirjoitti:

Puurakenne on muutenkin heikko ratkaisu, sillä valitettavan usein sivustojen API:t palauttavat elokuvien nimet typotettuna

Mitä väliä tällä on? Haku ei varmaan palauta niitä typotettuja tapauksia silloinkaan, kun hakuun kirjoittaa tarkat tiedot, koska silloin ne eivät vastaa hakua.

Codeclown [03.12.2011 17:29:18]

#

Metabolix kirjoitti:

Asetukset ovat kyllä ihan kunnossa, kiitos kysymästä. En väittänyt, ettei muutos olisi sinänsä aivan näkyvä. En vain välttämättä tuijota ruutua silmä kovana juuri silloin, kun painan enteriä, joten mielessä ei ole välitöntä vertailukohtaa ennen ja jälkeen lähetyksen. Tietenkin nyt näen eron vaikka silmät kiinni, kun olen kiinnittänyt asiaan näin paljon huomiota, mutta nimenomaan aluksi en ollenkaan muistanut, oliko sivu tummempi ennen klikkausta – nimittäin jotkin sivut ovat normaalitilassa järjettömän vaaleita. Onneksi haku tuntuu yleensä toimivan niin nopeasti, että ei ole aikaa miettiä asiaa. Satuin ehkä vain huonoon aikaan paikalle, kun meni tosiaan useampi sekunti.

Tapahtuiko mainitsemasi useamman sekunnin viive vain ensimmäisellä haulla? Päivitin nimittäin aikaisemmin tänään mysql-yhteyden jatkuvaksi. Viive johtui siitä, jos palvelua ei ollut kukaan vähään aikaan käyttänyt, jolloin uusi mysql-yhteys kesti kauemmin.

Metabolix kirjoitti:

Eivätkö kaikki sitten etsi tiettyjä subeja? Yleensä on varmaankin elokuva jostain hankittuna ennen tekstejä. Kun jo elokuvan koko nimi on yli 50 merkkiä ja julkaisu ja vuosiluku vielä lisää, olisi aika toivottavaa, että naputtelusta voisi jotenkin luistaa ja saada silti hyvät tulokset helposti selattavassa muodossa. :) Ehdotteleva tekstinsyöttö olisi myös yksi apu tähän, jos kaistasi kestää.

Haluatko ehdottaa, miten tuloksista saa "hyvät" ilman että tietää, mitä hakija haluaa. Toki voi naputtaa talteen suosituimmat subit, ja näyttää ne ensimmäisenä, mikä ei kuitenkaan edelleenkään ole tarpeellista. Itse ainakin löydän tietyt subit Findsubsilla kirjoittamalla alle 50 merkkiä.

Metabolix kirjoitti:

Mitä väliä tällä on? Haku ei varmaan palauta niitä typotettuja tapauksia silloinkaan, kun hakuun kirjoittaa tarkat tiedot, koska silloin ne eivät vastaa hakua.

Nimenomaan palauttaa, esim. sarjan jakson nimi voi olla esitetty eri tavalla, mutta hakiessa pelkällä numerolla saa kaikki näkyviin. Puurakenteessa nämä kaikki luovat oman oksansa.


Sivun alkuun

Vastaus

Aihe on jo aika vanha, joten et voi enää vastata siihen.

Tietoa sivustosta