Google er den største og mest populære søgemaskine og finder 3 milliarder websider (der findes mange flere!). Den sorterer siderne efter et hemmeligt system, men det vigtigste er at sider som mange andre websider har links til, kommer øverst i listen.
Google kan ikke alt
Bemærk, at man ved Googlesøgning undertiden skal trykke SHIFT-tryk på linkene, for at linkene vises foran Google-siden, og ikke skjult bagved Google-siden!
Søgning på bestemte sider, f.eks. danske universitets sider:
site:ku.dk OR site:au.dk OR site:auc.dk OR site:sdu.dk.
Hvis du opdager en useriøs spamside, kan du skrive til: Google (www.google.com/contact/spanreport.html), MSN (support.msn.com/feedbacksearch.aspx) og Yahoo ( add.yahoo.com/fast/help/us/ysearch/cgi_reportsearchspam). De vil så undersøge om der er grundlag for at straffe siden eller helt fjerne dem fra indekset.
Blog om Googlesøgning: http://erikhoy.blogspot.com/2005_03_01_erikhoy_archive.html
Find artikler fra et bestemt tidsskrift. Prøv at finde ud af hvad der er specielt for de tidsskriftartiklerne. Fx er Scientific Americans artikler næsten altid angivet med en copyright-angivelse: scientific american inc all rights reserved. Frasesøg med denne sætning og et søgeord, fx lomborg. Det giver et overskueligt antal artikler i fuldtekst brugt med tilladelse fra Scientific American.
Bemærk i øvrigt om Google:
1) Du finder ikke ord, som på Internettet er skrevet forkert (søg også på almindelige stavefejl)
2) Du finder ikke ord, der er skrevet spatieret, dvs. med mellemrum mellem hver bogstav (søg også med lighedstegn mellem bogstaverne, f.eks. sådan t=e=m=p=e=r=a=t=u=r)
3) Google finder IKKE alle relevante sider på Internettet (brug andre søgemaskiner til supplement).
4) Google søger nu også på varianter af ord. For en sikkerheds skyld kan man dog også søge på varianter af ordet. Husk at søgning på HEST ikke finder sider med ordet HESTE!. Man må søge på alle relevante ordformer med OR (ELLER) imellem, altså: entalsord, flertalsord, ordforbindelser, ordet på andre sprog.
5) Man kan efter sigende højst bruge ca. 10 ord i en søgesætning (Ved forsøg lykkedes det dog at få korrekte Internetsider trods langt flere ord i søgningen).
Tidligere kunne man indsætte * (stjerne) i stedet for nogle af ordene i rækkefølge. Forsøg viste, at det kan man ikke mere. Google ændrer sig.
6) Stopord vil ikke kunne findes (f.eks. ord som "how" og "where" og enkelttal eller enkeltbogstaver. Dette kan forhindres med +, f.eks. world war +2, eller man kan indramme søgeteksten i ", f.eks. "to be or not to be". Indsæt et + hvis alm. ord skal sikres medtaget, f.eks. "Star Wars Episode +I".
7) Rækkefølgen af ordene i søgestrengen påvirker resultatet.
8) Tegn i søgestrengen opfattes som ord-adskiller. [Undtagelser - fordi disse tegn har specielle betydninger ved en googlesøgning - er gåseøjne ( " ), plustegnet ( + ), minustegnet og bindestregen ( - ) samt og-tegnet ( & ).] 9) Og-tegnet ( & ) opfattes som et valgfrit bogstav (eller tal) i søgestrengen.
10) Hvis man vil bruge ELLER-funktionen skal der skrives "OR" med STORE BOGSTAVER, f.eks. vacation london OR paris.
11) Søgning kan begrænses til et bestemt websted, f.eks. admission site:www.stanford.edu eller man kan i en søgning udelukke (med minus-tegnet) et bestemt websted, f.eks. admission -site:www.stanford.edu
12) Du kan tidsbegrænse søgningen (med Julianske kalenderdage), f.eks. Star Wars daterange:2452122-2452234 Den julianske dato er beregnet som antallet af dage siden 1. jan. år -4713. F.eks. er 1. aug.2001 datoen 2452122. Så kan man lægge 365 dage til årligt. FIND DATERANGE-DATOEN HER:. Eksempler: 1.jan.2007 = 2454102; 31.DEC.2007 = 2454466
13) For at undgå at der ved søgningen også findes websteder, hvor søgeordet kun findes i teksten og ikke i titlen kan man begrænse søgningen til titlen, f.eks. intitle:vildkatte. Hvis alle ord skal være i titlen skrives allintitle:vildkatte
14) Hvis søgeordet SKAL være i url-titlen skrives inurl:vildkatte. Dette virker kun på ét ord, så hvis der søges på flere ord, der alle skal være i url-titlen, skrives koden foran hvert ord, f.eks. inurl:vildkatteinurl:norge eller allinurl:vildkatte norge. "allinurl: vildkatte/norge" findes url-titler hvor ordet "vildkatte" og ordet "norge" indgår (ignorerer skråstregen og ordrækkefølgen)
15) Man kan udelukke f.eks. fund med pdf-filer ved at bruge koden "filetype", f.eks. vildkatte filetype:doc -filetype:pdf
16) Man kan hente websider, som indeholder links til en bestemt side: link:www.bionyt.dk
17) Man kan hente websider, som er beslægtet med en bestemt side: related:www.bionyt.dk
18) Man kan hente websider, som er hentet af google fra en bestemt side: catch:www.bionyt.dk, samtidig har man den fordel, at søgeordene er fremhævet i teksten. Man risikerer at siden kan være opdateret senere, og dette mister man i så fald.
Det anbefales kraftigt at downloade og installere Google Toolbar på computeren. (Derved er Google altid vist som et søgefelt).
Ved venstreklik på dette ikon kan man vælge forskellige sprog "OPTIONS/"USE GOOGLE SITE" (f.eks. Google.com [ØVERST PÅ LISTEN], Google.dk osv.).
Man får flere valgmuligheder med Google.com (Web, Images[BILLEDER], Groups[DISKUSSIONSGRUPPER], News, Froogle[INDKØB], Local, more ») end med Google.dk (hvor valgmulighederne er Nettet, Billeder, Grupper, Katalog)
MORE = Under dette punkt er der mulighed for at søge inden for visse kategorier, f.eks. sundhed, sport, kunst osv. (En test afslørede, at dette var meget engelsk-orienteret). Oplysninger om avanceret brug af google kan findes her: http://www.google.com/help/refinesearch.html Eller man kan lave en søgning på "http://www.google.com/advanced_search" og så bruge den søgestreng, som Google selv danner - idet man kan ændre på søgekriterierne i søgestrengen
Googlesøgning er ligeglad med store og små bogstaver.
BEMÆRK:
Visse andre søgemaskiner skelner mellem små og store bogstaver under søgningen!
Bruges "boolean" i Google?
Ja, man bruger AND og OR.
Der kan bruges paranteser.
Det såkaldte pipe-sign "|" (ALT=124) betyder OR og kan skrives med (ALT-GR ´). Tegnet vises længst til højre på tasten. På nogle tastaturer er det (ALT-GR <).
OR (ELLER-kommandoen)
BEMÆRK: Det er bestemt ikke ligegyldigt om man skriver "or" eller "OR"!
EKSEMPEL: hest or dinosaur Dette gav 18.300 fund. (ordet "or" ignoreres ved søgningen, som dermed kræver tilstedeværelse af begge ordene "hest" og "dinosaur" i de fundne sider. hest OR dinosaur Dette gav 6.300.000fund. (fordi "OR" betegner kommandoen "ELLER!" dvs. at der findes alle sider med ENTEN ordet "hest" eller ordet "dinosaur").
AND (Og-kommandoen)
hest and dinosaur Dette gav 18.300 fund. (samme fund som hest or dinosaur eller hest dinosaur eller dinosaur hest eller dinosaur AND hest ville give)
Ikke-kommandoen
Hvis et ord IKKE må medtages under søgningen skrives minustegn lige foran ordet. (Google bruger ikke NOT).
EKSEMPEL: kat OR (hunde -hund) +kina. (Finder dansk filmside: "I Kina spiser de hunde") kat OR (hunde - hund) +kina. (Finder også norsk filmside: "I Kina spise de hund").
BEMÆRK: Hvis der er mellemrum efter minustegnet fungerer det IKKE som negationstegn!
Personsøgninger
Ved at skrive "Who is" eller "who was" i søgefeltet fås links til sider om personer.
Tegn sat før og efter søgningen
Disse specialtegn synes ikke at virke mere i Google.
Tidligere anvendtes:
EKSEMPEL: >cholesterol drug +site:edu
("avanceret søgning"). ??"George Bush"
(Google Directory søgning). ,group:sci.med* dermatology
(kommaet = Google Groups søgning). heste/ifl
(/ifl = "I feel lucky", dvs. gå straks til 1. fund). heste! (= "I feel lucky", dvs. som ovenstående) heste /advanced (avanceret søgning)
TILSVARENDE:
/groups = grupper; /directory=Google directory; /images = billeder; /news=Google News; /since:days = dage siden; /cache = tidl. version; /related=beslægtet; /link = link til en URL; /france = Frankrig; /language:xx (f.eks. /language:ms for fund i malaysisk sprog).
SOM SAGT SYNES DISSE TEGN FØR OG EFTER EN SØGNING IKKE AT VIRKE MERE I GOOGLE.
Nummerinterval-søgning
Man kan søge efter tal, der ligger inden for et angivet interval, ved at indsætte to mellemrum efter hinanden.
Det er vigtigt at angive tallenes enhed, f.eks. kg, $ osv.
EMSEMPEL:
[DVD player $50..$100] søger efter DVD player som koster fra 50 til 100 dollar.
[Willie Mays 1950..1960] søger på navnet "Willie Mays" for perioden 1950-1960
[5000..10000 kg truck] søger på en truck (lastbil) med 5000 - 10000 kg vægt.
Sprog
Man kan søge efter sider, der er skrevet på et bestemt sprog, men som samtidig er udgivet i et andet land.
EMSEMPEL:
FIND SIDEN http://www.google.com/language_tools?hl=en
BRUG SØGEORD "SVIN", SEARCH PAGES WRITTEN IN "DANISH", SEARCH PAGES LOCATED IN "LATVIA".
RESULTATET HERAF ER:
http://www.google.com/search?lr=lang_da&cr=countryLV&q=svin&hl=en&safe=off&ie=UTF-8&oe=UTF-8
(DER ER TO FUND, SKREVET PÅ DANSK, NEMLIG TO WEBSIDER I LETLAND, OG DE HANDLER OM SVIN I LETLAND). Fordelen ved både at bruge sprog og land er, at der fås meget færre og mere præcise fund. Hvis man i stedet søger på "SVIN LETLAND" vil man få 521 fund.
Oversættelse
http://translate.google.com/translate
Der er kun mulighed for at oversætte mellem engelsk, tysk, fransk, italiensk, portugisisk, spansk, koreansk og kinesisk. Ikke fra/til dansk. Oversættelsesfunktionen fungerer elendigt.
Hvordan søges inden for en bestemt hjemmeside? (Site-funktionen)
site: giver mulighed for at søge på et bestemt webside-efternavn. Det kan bruges til at begrænse søgningen til en internetside, f.eks. BioNyt's internetside.
EKSEMPLER: site:bionyt.dk
eller site:BIONYT.DK
BEMÆRK at "site" SKAL skrives med små bogstaver
Eksempelvis vil SITE:BIONYT.DK eller Site:BIONYT.DK ikke give nogen fund!
BEMÆRK også, at der IKKE må være mellemrum efter kolon! site:bionyt.dk finder ca. 4150 steder i Google site: bionyt.dk finder ca. 304 steder i Google, nemlig sider med ordet "site" og sammensætningen "bionyt.dk" (hvilket jo er noget helt andet)!
site: kan også bruges til at begrænse søgningen til et land, f.eks. Danmark = "dk".
EKSEMPEL: site:dk finder ca. 8 millioner fund, alle fra Danmark (hvoraf Google dog kun viser ca. 800 stk). site:se finder ca. 18 millioner fund, alle fra Sverige (hvoraf Google altså kun viser et begrænset antal).
site: kan også bruges til at begrænse søgningen til en type institution f.eks. edu (undervisning), com (kommerciel), gov (regering) eller org (institution)
EKSEMPEL: site:edu finder ca. ½ millard fund, alle fra undervisningsinstitutioner (hvoraf Google altså kun viser et begrænset antal) site:com finder ca. 1½ millard fund, alle kommercielle, f.eks. bogforlag (hvoraf Google altså kun viser et begrænset antal) site:gov finder ca. 350 mill. fund, alle fra regeringskontorer og offentlige institutioner, f.eks. det amerikanske landbrugsministerium (hvoraf Google altså kun viser et begrænset antal) site:org finder ca. 800 mill. fund, alle fra institutioner, f.eks. et websted for fysikere (hvoraf Google altså kun viser et begrænset antal)
Synonym-søgning:
Indsæt tegnet "tilde" foran ord (kopiér det her: ~) hvorved Google også finder synonymer
EKSEMPEL:
Søgningen [~food ~facts] vil finde "food facts", "nutrition facts", "food information", "cooking information" osv.
intitle:
intitle: kræver at søgeordet findes i Internetsidens titel
EKSEMPEL: intitle:grønland giver ca. 900.000 fund.
BEMÆRK at der IKKE må være mellemrum efter kolon! intitle: grønland giver kun ca. 12 fund i Google, nemlig sider med både ordet "intitle" og ordet "Grønland"
BEMÆRK iøvrigt at ved søgning på Grønland findes også sider med Grönland og Groenland. allintitle: skulle efter sigende kræve, at søgeordene samlet set udgør hele Internetsidens titel (Dette krav virkede dog ikke ved en test, idet Google fandt alle websider, hvor ordet Grønland blot indgik. allintitle: kan efter sigende ikke altid bruges med andre søgekrav)
EKSEMPEL: allintitle:grønland giver samme antal fund som intitle:grønland
BEMÆRK at det i dette tilfælde er tilladt at bruge mellemrum efter kolon, hvilket er usædvanligt og adskiller sig fra de normale regler i Google
inurl:
inurl: kræver at søgeordet findes i Internetsidens URL, dvs. websidens navn
EKSEMPEL: inurl:grønland giver ca. 900.000 fund, dog kun lidt færre fund end intitle:grønland .
BEMÆRK at der IKKE må være mellemrum efter kolon! inurl: grønland giver kun ca. 100 fund i Google, nemlig sider med både ordet "inurl" og ordet "Grønland" allinurl: skulle efter sigende kræve, at søgeordene samlet set udgør hele Internetsidens navn (Dette krav virkede dog ikke ved en test, idet Google fandt alle websider, hvor ordet Grønland blot indgik. allinurl: kan efter sigende ikke altid bruges med andre søgekrav)
EKSEMPEL: allinurl:grønland giver samme antal fund som intitle:grønland
BEMÆRK at det i dette tilfælde er tilladt at bruge mellemrum efter kolon, hvilket er usædvanligt og adskiller sig fra de normale regler i Google
intext:
intext: skulle efter sigende kræve, at søgeordene findes i websidens text (dvs. ikke i link-tekster, websiders URL-navne og websiders titler
EKSEMPEL: intext:grønland giver ca. 1,4 million fund.
BEMÆRK at der IKKE må være mellemrum efter kolon! intext: grønland giver kun ca. 100 fund i Google, nemlig sider med både ordet "intext" og ordet "Grønland" allintext: findes, men har ingen speciel brug, da det giver samme fund som intext:.
EKSEMPEL: allintext:grønland
BEMÆRK at det i dette tilfælde er tilladt at bruge mellemrum efter kolon, hvilket er usædvanligt og adskiller sig fra de normale regler i Google
inanchor:
inanchor: skulle efter sigende søge efter teksten i en sides link-ankere (et link-anker er den beskrivende tekst for et link).
EKSEMPEL: inanchor:grønland giver ca. 894.000 fund.
Det virker usandsynligt, at inanchor: fungerer korrekt i dette tilfælde.
BEMÆRK at der IKKE må være mellemrum efter kolon! inanchor: grønland giver kun ca. 3 fund i Google, nemlig sider med både ordet "inanchor" og ordet "Grønland"
link:
link: finder sider, som linker til en bestemt URL-adresse.
EKSEMPEL: link:www.bionyt.dk giver 65 fund.
BEMÆRK:
link:bionyt.dk og
link:bionyt kan ikke bruges! Glem ikke "www" foran!
cache:
cache: finder sider, som tidligere er blevet fundet af Google, selv om siden siden er slettet eller ændret. Dette er særlig nyttigt for sider, som ændres meget hyppigt.
EKSEMPEL: cache:www.bionyt.dk
daterange:
daterange: begrænser søgningen til en dato eller tidsperiode, hvor Google gennemså websiden. (Datoen har altså ikke noget at gøre med hvornår siden blev lavet af webmasteren). Bemærk også, at hvis sidens indhold ikke ændres bliver sidens dato stående, selv om Google har været inde og kikket på den senerehen.
Datosøgning bruger Juliansk kalender (ikke den almindelige Gregorianske kalender). Der er en omregningstabel her: http://www.faganfinder.com/engines/google.shtml
EKSEMPEL: "George Bush" daterange:2452389-2452389
30.dec.2003-1.jan.2004 = i søgestrengen noteres (uden " og mellemrum) "daterange%3A2453003-2453005"
filetype:
filetype: søger efter filnavn-endelser (suffix'er). Det er normalt forskellige filtyper. BEMÆRK at søgning på filetype:htm og filetype:html vil give forskellige resultater (selv om de er samme filtype). Man kan søge på side-generatorer såsom ASP, PHP, CGI og så videre.
BEMÆRK: PPT er powerpoint-sider. XLS er excel-sider. DOC er Word-sider.
EKSEMPEL: grønland filetype:pdf (Finder 67000 Powerpoint-sider om Grønland).
related:
related: finder sider som er beslægtet med en bestemt side. Dette kan bruges til at finde forskellige kategorier af Internetsider.
EKSEMPEL: related:google.com (Finder andre søgemaskiner, bl.a. Yahoo og AltaVista).
BEMÆRK: Der må ikke være mellemrum efter kolon'et ! I så fald vil Google søge på ordet "related" og det går selvfølgelig helt galt.
info:
info:www.bionyt.dkGiver en følgende supplerende muligheder for at studere en Internetside: 1) Ændre version af siden (cache). 2) Lignende sider ("related"). 3) Sider med links der peger på siden. 4) Sider som i teksten omtaler websiden.
EKSEMPEL: info:www.bionyt.dk Dette gav ét fund, nemlig www.bionyt.dk, men under dette fund er der de fire ovennævnte muligheder.
BEMÆRK: Der må ikke være mellemrum efter kolon'et. Altså IKKE info: www.bionyt.dk idet man så kommer til at søge på ordet "info".
BEMÆRK: At man (ud over cache-versionen og related-versionen) tilbydes en oversigt over sider, som indeholder links til den pågældende side (se under søgeresultatet).
f.eks. http://www.google.com/search?hl=de&lr=&rls=GGLD,GGLD:2004-18,GGLD:en&q=link:3FxEk59voB8J:www.bionyt.dk/ (Denne søgning gav 65 fund, hvoraf Google viser 46)
BEMÆRK DESUDEN: At man tilbydes en oversigt over sider, som indeholder den pågældende websides URL-adresse (se under søgeresultatet).
f.eks. http://www.google.com/search?hl=de&lr=&rls=GGLD,GGLD:2004-18,GGLD:en&q=%22www.bionyt.dk%22 (Denne søgning gav 1400 fund, hvoraf Google viser de første 237)
phonebook:
phonebook:
EKSEMPEL: phonebook:John Doe phonebook:(435) 640-6414
Det lykkedes ikke Google at finde numrene ved et forsøg. I stedet kan man søge telefonnumre på http://www.phonebookoftheworld.com/ eller ved Googlesøgning på "phonebook" eller en oversættelse af dette ord.
Søgebox
Man kan på hjemmesiden have sin egen søgebox til Google, hvilket muliggør justering af søgeresultatet.
På hjemmesiden indskrives følgende:
(idet PPT er powerpoint, andre muligheder er TXT = ren tekst; PDF = Adope PDF; DOC = Worddokument, XLS = Excel-dokumenter og så videre)
< input type="hidden" name="as_sitesearch" value="example.com">
< input type="hidden" name="as_sitesearch" value="tompeters.com">
< input type="hidden" name="as_sitesearch" value="
< input type="hidden" name="as_sitesearch" value="loc.gov">
< input type="hidden" name="as_sitesearch" value=".com">
(dette begrænser søgningen til en bestemt side, dvs. f.eks. et bestemt domæne)
< input type="hidden" name="as_qdr" value="m1">
< input type="hidden" name="as_qdr" value="m5">
< input type="hidden" name="as_qdr" value="m12">
(dette begrænser søgningen til sider som er indekseret inden for de sidste f.eks. 1, 5 eller 12 måneder; man kan vælge fra 1 til 12 måneder; det anbefales generelt at bruge 6 måneders begrænsning)
< input type="hidden" name="num" value="50">
< input type="hidden" name="num" value="100">
(dette specificerer det ønskede antal websteder, som skal hentes pr. sideopslag. Der kan vælges fra 1 til 100.)
Hvor findes Google:
Google findes blandt andet på adresserne Google.com og www.google.dk
Bruges "wildcards" i Google?
Ja, der bruges en stjerne (*) for et eller flere ord.
Bemærk at Google ikke har et wildcard for en del af et ord, f.eks. kan man ikke finde ord med forskellige endelser, men må selv skrive alle formerne!
Litteratur om programstumper, som kan bruges i forbindelse med Google:
Bogen: Google hacks - 100 industrial-Strength Tips & Tools, Tara Calishain & Rael Dornfest. Findes på folkebiblioteker under nr. 02.16 (bl.a. Frederiksberg Bibliotek).
Særlige tegn til brug ved søgning i Google
+ Plustegnet i Google bruges når et ord SKAL findes i fundresultatet
- Minustegnet i Google bruges når et ord IKKE MÅ findes i fundresultatet
OR Dette betyder "eller" og betyder valgfrihed om ordet skal findes i fundresultatet
" " Citationstegn bruges når ordene skal stå sammen; det er tilladt at bruge * for valgfrie ord ind i mellem.
Eksempler på søgninger med Google
Søgesætningen
sea blue histiocytes OR histiocytosis
betyder underforstået:
(sea AND blue) AND (histiocytes OR histiocytosis)
dvs. at både "sea" og "blue" SKAL findes og at enten "histiocytes" eller "histiocytosis" skal findes.
"harry potter" trivia game
Både sætningen "harry potter" og ordet "trivia" og ordet "game" skal findes.
vegetarian site:www.peta.com
Ordet "vegetarian" skal findes, og der søges kun på sider fra websiden http://www.peta.com.
intitle:"lord voldemort" harry potter
Den præcise sætning "lord voldemort" skal findes i titlen. Desuden skal begge ordene "harry" og "potter" findes i teksten.
intitle:"gilmore girls" episode guide OR guides
Sætningen "gilmore girls" skal findes i titlen. Ordet "episode" skal findes samt ENTEN "guide" eller "guides".
inurl:harrypotter
Ordet "harrypotter" skal findes i URL (websidens navn).
link:darkmark.com
Alle sider som har links til http://darkmark.com) findes.
related:www.the-leaky-cauldron.org
Sider som er lignende til http://www.the-leaky-cauldron.org findes
hypertension OR "high blood pressure" site:org OR site:edu treatment
Enten ordet "hypertension" eller sætningen "high blood pressure" skal findes i søgeresultatet, og desudenskal ordet "treatment" være i søgeresultatet. Søgeresultatet skal komme fra non-profit organisation (org) eller uddannelsesinstitution edu) (dvs. educational) domæner.
intitle:aids central OR latin america women site:org OR site:edu OR site:gov
Ordet "aids" skal være i titlen. Ordene "america" og "women" skal være til stede. Enten ordet "central" eller "latin" skal være til stede. Søgeresultatet skal komme fra non-profit organisation (org) eller uddannelsesinstitution edu) (dvs. educational) domæner.
Oversigt over Google-søgemaskinen
http://www.google.com
o Alle søgeord skal findes i resultaterne (Kan modificeres ved avanceret søgning)
o Udelukker automatisk almindelige ord (det kan give problemer når et dansk ord er lig med et almindeligt engelsk ord)
o Det er uden betydning om man bruger store bogstaver (Kan modificeres ved avanceret søgning)
o Man kan søge på billeder (Image search)
o Der er et index (Directory)
o Finder ens sider (Se link ved hvert fund)
o Brugeren kan ændre på hvordan Google skal levere resultaterne (preferences)
o Mulighed for at undgå pornosider (Safe-search filter options)
o Oversætter websider eller tekst med oversætterværktøj
o Ved brug af InternetExplorer fremhæves søgeordene i den fundne tekst, og fundene gives relevanskarakter
Avanceret søgning for Google:
o Man kan bruge +, -, OR, " " (AND behøver ikke at bruges da det er underforstået)
o site: Søger domænesiden
o allintitle: (Alle ord skal være i titlen)
o intitle: (første ord efter "intitle:" skal være i titlen, andre efterfølgende ord kan være andre steder i fundsidernes tekst)
o link: (finder links)
o related: (finder lignende sider)
o info: (viser hvilken information Google har om siden)
o spell: (kontrollerer stavningen for orden og tilbyder alternativer)
o stocks: (finder information om en aktie ved hjælp af dens forkortelse "ticker symbol")
o cache: (finder gammel version af siden; undertiden er den nye version lukket, mens den gamle stadig kan ses)
o allinurl: (alle ord skal være i URL (websidens navn), idet punktummer ignoreres)
o inurl: (det første ord efter "inurl:" skal være i websidens navn)
Eksempler kan ses her:
http://www.google.com/help/operators.html
http://www.google.com/help/
Indstilling af Google
Hvis man vil have Google til at undersøge hjemmesiden på en særlig både kan bruges "robotter", se: www.robotstxt.org/wc/norobots.html
Fjernelse af sider fra Google
Hvis en side ikke skal vises for Google skrives
< META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">
For at undgå at Google viser et stykke af den fundne side kan indføres linien:
< META NAME="GOOGLEBOT" CONTENT="NOSNIPPET">
For at undgå at Google beholder en tidligere gemt version af gamle versioner af hjemmesiden kan indføres linien:
< META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">
Hvis en side skal slettes fra Google:
< META NAME="GOOGLEBOT" CONTENT="NOINDEX", "NOFOLLOW">
Hvis UDTRÆK fra siden (kaldet en "snippet") ikke skal vises ved en søgning på Google:
< META NAME="GOOGLEBOT" CONTENT="NOSNIPPET">
Hvis en side ikke skal gemmes (i gamle cache-versioner) af søgemaskiner som Google skrives øverst i HEAD-sekteionen:
< META NAME="ROBOTS" CONTENT="NOARCHIVE">
Hvis kun Google ikke skal se siden skrives:
< META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">
STRAKS-fjernelse af en side, som findes via Google:
http://services.google.com:8882/urlconsole/controller
(de ovenfor nævnte "exclusion tags" skal være lavet før Google kontaktes)
Kræve at Google fjerner et billede, som du har copyright til:
http://www.google.com/remove.html [Option 2: "If you do not have any access to the server that hosts your image"].
Ellers kan laves en "robots.txt" fil med linierne:
User-agent: Googlebot-Image
Disallow/´: /
Fjerne dit telefonnummer fra Google:
http://www.google.com/help/pbremoval.html
For at undgå at Google viser billederne fra siden:
Brug robots.txt på følgende måde: (2 linier)
User-agent: GOOGLEBOT -Image
Disallow: /
Google gennemsøger websiden hver måned, hyppigere hvis den opdateres hyppigere.
Hvordan rapporteres spam?
Rapportering spam til Google: www.google.com/contact/spamreport.html
Hvilke andre søgemaskiner findes end Google?
De vigtigste er:
alltheweb.com (Bemærk at når en webside ender på "com" behøver man ikke at skrive "www" foran)
altavista.com
http://search.aol.com
http://askjeeves.com
ask.com
excite.com
hotbot.com
looksmart.com
lycos.com
msn.com
http://search.netscape.com
http://dmoz.org (Denne søgemaskine kaldes "Open Directory", bygger på tusinde af frivilliges indexeringsarbejde, der sælges til Lycos, HotBot og Netscape)
teoma.com
yahoo.com (kombinerer resultater fra Google med deres eget meget støre emnekartotek, lavet af 150 ansatte, der fordeler siderne på et let anvendeligt og populært index
www.ipl.org (Kaldes "Internet Public Library; indexeres af bibliotekarer, medtager information om bøger)
www.lii.org (En online-referencebibliotekar - liste over bibliotekarkommenterede internetsider)
http://www.completeplanet.com
http://infomine.ucr.edu
http://www.invisibleweb.com
http://www.freepint.com/gary/direct.htm
AltaVista
AltaVista kan være meget mere specifik og meget mere kompleks end Google, fordi Google kun tillader at man bruger 10 ord til søgningen. (Man kan i praksis opnå flere ord i søgestrengen ved at indsætte stjerne * for flere ord i en sætning. Google tillader heller ikke valgfrie bogstaver i ord og valgfrie ordendelser. Google behøver ikke AND. Google anvender site: i stedet for domain: hos AltaVista, der også i stedet kan bruge host: Google kan ikke forstå NEAR.
AltaVista søgning:
(title:aids OR title:hiv) AND ((central OR latin) NEAR america*)AND (statistic* OR rate*) AND (wom*n OR mother* OR female*) AND (domain:org OR domain:gov OR domain:edu) AND NOT host:www.cdc.gov
Dette betyder:
o ENTEN orden "aids" ELLER "hiv" i titlen.
o ENTEN ordet "central" ELLER "latin" i resultatet OG placeret tæt på ordet "america" (ELLER americas, american ELLER americans).
o ENTEN ordet "statistic" (eller statistics eller statistical osv.) ELLER "rate" (eller rates eller rated osv.) skal forekomme.
o En eller flere af ordene "women" (eller women), "mother" (eller mothers eller motherhood osv.), ELLER "female" (eller females) skal forekomme.
o Resultaterne skal være fra websteder hos ENTEN non-profit organisationer (org), regering (gov, dvs. governmental), eller uddannelsesinstitutioner (edu, educational) websider.
o Resultatet MÅ IKKE være fra http://www.cdc.gov (Centers for Disease Control and Prevention webside).
http://www.altavista.com (meget gammel og meget stor søgemaskine med meget avancerede søgemuligheder. Giver ikke så mange svar som Google. Den rangerer fundsiderne efter hvor mange søgeord der er i et dokument, hvor ordene er og hvor tæt de er på hinanden.
o Søgning er mulig for billeder, lyd, video, nyheder
o Index findes
o Søger først resultater med alle ord, derefter resultater med hvert enkelt ord
o Hvert fund har en "Related" knap (beslægtet webside)
o Oversætter websiderne eller teksten ved anvendelse af et oversættelsesværktøj
o Der er en almindelig og en avanceret søgeindgang
o Password kan indsættes for "Family filter" (dvs. undgå pornosider)
o Har den mest avancerede søgemulighed blandt alle søgemaskiner:
Avanceret søgning:
o Man kan bruge følgende operatorer: +, -, "", (), AND, OR, AND NOT, NEAR
o Man kan bruge stjerne (*) for valgfrie dele af søgeord (kræver dog 3 bogstaver først). Dette kaldes "stemming", "truncation" eller "wildcards"
o Anker (anchor:) finder ord en teksten af et link
o Finder domæne (domain:)
o Finder vært (host:), dvs. søger kun på specifikt site
o Finder billede (image:)
o Finder dubletsider (like:) (finder sider som er ens)
o Finder links (link:)
o Finder tekst (text:) (finder ord i tekst som ikke er URL (websidens adresse), billedhenvisninger og links)
o Finder titler (title:)
o Finder hjemmesider (url:)
o Finder Java-programsteder (applet:)
Oplysninger om AltaVista søgemaskinen:
http://help.altavista.com/adv_search/syntax
http://www.altavista.com/sites/help/search/default
Andre eksempler på avanceret søgning:
http://www.searchenginewatch.com/facts/math.html
http://www.searchenginewatch.com/facts/powersearch.html
http://www.searchenginewatch.com/facts/assistance.html
Find information om nyheder:
Søg på: news OR rumors OR rumours "søgesætning" "søgesætning" (Denne søgning KRÆVER at "søgeord" findes, og at ET AF ORDENE "news", "rumors" eller "rumours" også forekommer. (Google kan ikke udføre en OR-søgning med to søgesætninger, såsom søgningen: "harry potter year 5" OR "order of the phoenix"
Søgning på særlig webside:
"order of the phoenix" site:darkmark.com (søger sætningen på www.darkmark.com og ikke andre domænesider)
Søgning på kommercielle sider:
"order of the phoenix" site:com (Finder søgesætningen på et kommerciel domæne (com) står for "commercial".
Søgning med vivisimo
http://vivisimo.com (Vivisimo er en metasøgemaskine, som gennemsøger 11 søgemaskiner samt en række specialdatabaser samt regeringsdatabser, PubMed, eBay og patentdatabaser og grupperer svarene).
Begrænsning af domænetypen af internetsider ved en søgning:
intitle:"rare diseases" site:.org OR site:.gov OR site:.edu
Internetsider som ender på .com, .gov, .edu, .org, .mn.us, .co.uk, .gov, .edu og .org er ofte gode informationskilder, og ofte fra regeringer, uddannelsesinstitutioner eller non-profit organisationer.
Find det mest centrale i en web-adresse:
F.eks. http://www.biomed.lib.umn.edu/inst/lcclasshandout.html (Her er umn.edu det basale hoveddomæne; det centrale findes efter http:// og før næste /; "biomed" og "lib" er underdomæner)
Hvordan vurderes hjemmesider?
Find forfatteren til internetsiden:
Gå til det basale domænenavn, og prøv at identificere forfatteren til internetstedet. (f.eks. er det tilsyneladende pålidelige internetsted http://www.martinlutherking.org ved nærmere øjesyn uden forfatterinformation og med upålidelig information. Baggrunden herfor opdager man, når man slår denne internetside op på en WHOIS-index, f.eks:
WHOIS internetsteder:
http://www.whois.sc
http://www.whois.org
http://www.netsol.com/cgi-bin/whois/whois
Hvordan får en hjemmeside mange besøgende?
Gode råd om hjemmesider for at få mange besøgende:
Der skal være over 100 sider på hjemmesiden.
Domænenavnet skal være let at bruge som "brand"
Brug simpel design af siden, undgå tung Flash, Java, JavaScript
Siden skal komme straks, og i hvert fald under 3-4 sekunder. Der er 10% tab pr. ekstra sekund.
Siden skal være lille, jo mindre, jo bedre. Under 15 k incl. billeder. Bedst under 12 k. Endnu bedre under 10 k, eller under 5 k.
Byg en ny side hver dag, 200-500 ord.
Brug nøgleord i titel, "description tag, "heading", i URL, en gang i fed, en gang i italic, in gang højt på siden, tætheden af nøgleord skal være mellem 5% og 20%. Brug nøgleorden i link-tekst, idet der linkes til en højere rangerende side.
Lav krydslinks inden for samme site, fra side til side. Det skal undgås at een side har alle linkshenvisningerne. Det er bedre at der er 100 sider som har dem fordelt.
Alle sider skal være linket til mere end een side på sitet - og ikke mere end to niveauer dybt fra hovedsiden. Lad linkene gå lodret op til hovedsiden, ikke horisontalt til parallelsider.
Siden skal have en tæller, ikke en grafisk tæller, men en logger/tracker der viser logfiler.
Spørg andre steder "to swap links".
Tilføj en ny sider med kvalitetsindhold hver dag. Skriv Web Speak - egnet til en hurtig webkikker, vs. korte sætninge. Mange tankestreger. Noget der kan læses hurtigt. Webkikkere læser ikke men scanner. Det er grunden til at det er så vigtigt at holde sidens indhold til et minimum. Webkikkeren, der møder en teksttung side, vil ikke bruge 15 sekunder på den. Brug mange overskrifter med FED skrift. Det er scanner-stoppere. Det gælder også tekststykker i fed skrift.
Indsæt "Email a friend" knap
Forums og mailing lister
Lav sider hurtigt, når de er aktuelle.
Networking er afgørende.
Når man laver en side om dagen i nogle måneder vil en brainstorm dannes. Mens man kører bil, tager et brusebad osv. Skynd dig at skrive det ned. 10 minutter senere vil du have glemt det. Brug det nedskrevne når nye ideer ikke kommer.
PubMed http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?holding=mnumhelib (Medicinsk littetur efter 1960. Består af databaserne MEDLINE, HealthSTAR mv. samt OMIM (genetiske sygdomme) og sekvensdatabaser.
TOXLINE http://toxnet.nlm.nih.gov (Index til artikler om toxikologi. Er en del af TOXNET, som også omfatter kemiske stoffer og farlige stoffer.
HighWire http://highwire.stanford.edu (Hjælper udgivere med at sætte deres tidsskrifter online. Mange tidsskrifter kan søges via HighWire's hjemmeside). Man kan få tilsendt emails om ønskede emner fra ønskede tidsskrifter. Nogle af artiklerne er gratis.
AskERIC http://www.askeric.org (Index til undervisningsrelevant litteratur og en del sundhedsrelevant litteratur. Omfatter også ERIC-rapporter og bøger)
Minnesota Department of Health Library http://www.health.state.mn.us/library/library.htm
Bio-Medical Library, University of Minnesota Libraries http://www.biomed.lib.umn.edu
HealthWeb http://www.healthweb.org (Links til gode sundhedsrelevante sider på internettet, udvalgt af medicinsk biblioteks bibliotekarer. Omfatter også organisationer, vejvisere, statistik mv.)
MedWeb http://WWW.MedWeb.Emory.Edu/MedWeb/ (Index som laves af biblioteket p[ Emory University's Health Sciences Center og omfatter medicin, teknologi, undervisning mv.)
Sundhedsinformation for forbrugerne:
MEDLINEplus http://www.medlineplus.gov
Healthfinder http://www.healthfinder.gov
Regeringsressourcer:
National Institutes of Health http://www.nih.gov/
CancerNet http://cancernet.nci.nih.gov/
Centers for Disease Control and Prevention http://www.cdc.gov
National Guideline Clearinghouse http://www.guideline.gov
ClinicalTrials.gov http://www.clinicaltrials.gov
Oplysninger om forskellige søgemaskiner for internettet:
mere avancerede spørgsmål om søgemaskiner kan måske besvares her:
http://www.searchenginewatch.com/facts/math.html
http://www.searchenginewatch.com/facts/powersearch.html
http://www.searchenginewatch.com/facts/assistance.html