04-11-2016
Het is ervan gekomen. Via de pagina “Nuttige literatuur” kunt u vanaf heden het document downloaden dat u helpt om ‘science based’ of ‘evidence based’ criteria op te nemen in uw lastenboek, bestek of offerteaanvraag. Zo weert u de onzin en de pseudowetenschappers en komt u tegemoet aan het zorgvuldigheidsbeginsel, waar vooral overheden moeten op toezien.
Hierna vindt u de directe link:
http://evidencebasedhrm.be/wp-content/uploads/2016/11/Raadgevingen_lastenboeken.pdf
Contacteer ons indien u moeilijkheden ondervindt om de tekst te kopiëren uit het PDF-bestand. U kunt ook proberen onderstaande teksten te kopiëren uit deze wegpagina.
Inleiding
Er is een grote nood aan meer evidence based werken. Zowel vanuit moreel-ethisch standpunt (voorzichtige uitspraken doen over mensen omdat deze ernstige negatieve gevolgen kunnen hebben op het welzijn maar ook de socio-economische status van betrokkene en eventuele gezinsleden) als vanuit economisch standpunt (geen middelen verspillen).
Overheden hebben bovendien de verplichting om het zorgvuldigheidsbeginsel toe te passen. Ook al beschrijven wetteksten niet expliciet dat wetenschappelijke of ‘evidence based’ criteria dienen te worden gehanteerd, het lijkt ons van weinig zorgvuldigheid te getuigen indien men zich niet van wetenschap zou bedienen waar deze voorhanden is:
Advies
Om het zorgvuldigheidsbeginsel gemakkelijker te respecteren en uit te voeren is het opnemen van science en evidence based criteria sterk aangewezen. Zij geven een veel grotere kans op objectiviteit dan subjectieve begrippen zoals ‘ervaring’ en referenties van tevreden klanten. Over die (on)betrouwbaarheid bestaat overigens op zich ook wetenschappelijk onderzoek. Een aantal overheden heeft er al voor gekozen om wetenschappelijke deugdelijkheid als criterium op te nemen. Zo vermeldt de omzendbrief BZ 2014/5 van de Vlaamse Overheid dat “pseudowetenschappelijke praktijken (grafologie, astrologie, handlezing…) verboden zijn” bij selectieprocedures (hier te consulteren: https://overheid.vlaanderen.be/sites/default/files/Omzendbrief_BZ_2014_5.PDF)
Daarom stelden wij voorbeeldteksten op die u helpen om tegemoet te komen aan uw motivatieplicht. Dankzij deze teksten kunt u motiveren waarom u naar bepaalde informatie (échte bewijzen) vraagt en die u moeten helpen om een quoteringssysteem op te zetten dat een objectieve beoordeling garandeert.
Uitgangspunten
De uitgangspunten zijn eenvoudig gesteld de volgende:
Wij adviseren u om de punten hieraan toegekend voldoende te laten meetellen in uw lastenboek om aldus eenvoudiger en betrouwbaarder tegemoet te komen aan het wettelijk verplichte zorgvuldigheidsbeginsel. Stel dat u een gewicht van 60% geeft aan het evidence based criterium in de totale beoordeling (naast de klassieke elementen zoals het criterium van de prijs dat bijvoorbeeld 30% krijgt), dan kan u vergelijken tussen aanbieders die wetenschappelijk betrouwbare producten (bijvoorbeeld selectietesten) of diensten (bijvoorbeeld individuele coaching) aanbieden.
Wij raden u ook aan voldoende expertise te organiseren om deze criteria te beoordelen – bijvoorbeeld door een beroep te doen op academici van een universiteit die expertise in het domein hebben.
De werkgroep ‘evidence based lastenboeken’.
Bart Van de Ven
Peter Catry
Patrick Vermeren
Michel Vandermeulen
(ps: Deze teksten werden ook nagekeken door de raadsman van de vzw Evidence Based HRM, meester Patrick Cockx)
Wij verwachten dat u ons een aanbod maakt op basis van wetenschappelijk deugdelijke theorieën en praktijken op basis van de vier onderstaande criteria:
Maak een omschrijving van de wetenschappelijke status van de theorie waarop uw model of aanpak is gebaseerd en die u in dit dossier wenst in te zetten.
De theoretische deugdelijkheid telt mee voor maximaal XXX punten.
Maak een omschrijving van de empirische onderzoeken die werden uitgevoerd. Vermeld het soort onderzoek, de methodologie en de resultaten. Vermeld de volledig referentie van elk document waarnaar u verwijst (naam of namen, publicatiedatum, titel, naam van boek of wetenschappelijk tijdschrift). Vermeld eveneens de impactfactor van de publicatie en het beoordelende orgaan (bijv. Thomson-Reuters).
De empirische bewijsvoering telt mee voor maximaal XXX punten.
Maak een omschrijving van de gebruikte methodologie en de resultaten bij de constructie van de vragenlijst of test. vermeld de verschillende wetenschappelijke criteria die werden onderzocht en het resultaat. Vermeld de volledige referentie van elk document waarnaar u verwijst (naam of namen, publicatiedatum, titel, naam van boek of wetenschappelijk tijdschrift). De betrouwbaarheid en validiteit tellen mee voor maximaal XXX punten.
Met betrekking tot theoretische deugdelijkheid en empirische bevindingen, kennen wij daarboven maximaal XXX punten toe, in functie van de impactfactor van het tijdschrift. Daarom vermeldt u eveneens de impactfactor van de publicatie en het beoordelende orgaan (bijv. Thomson-Reuters) in volgende tabel:
Naam Tijdschrift | Impactfactor volgens/ ranking in domein
Beoordelend orgaan: YYY |
Rangschikking | Gewicht |
Top 10% binnen het vakgebied | 10 | ||
Volgende 15% | 8 | ||
Volgende 35% | 6 | ||
Volgende 20% | 4 | ||
Laatste 20% | 2 |
(voorbeeld: u neemt het voorbeeld eventueel over)
Indien geen enkele kandidaat-leverancier minstens 50% behaalt van de maximum punten toegekend aan deze wetenschappelijke deugdelijkheid, zal de procedure worden stopgezet.
Beoordeling van het criterium ‘theoretische deugdelijkheid’:
De theorie werd beoordeeld volgens een puntenschaal gaande van -6 tot +6. Uw theorie kreeg een beoordeling van …
Beknopte uitleg: …
Daardoor bedragen de punten voor dit onderdeel XXX op een maximum score van YYY.
Beoordeling van het criterium ‘bewijsvoering/empirische resultaten’:
De aangebrachte evidentie werd beoordeeld volgens een puntenschaal gaande van -4 tot +4. De door u aangereikte evidentie kreeg een beoordeling van …
Beknopte uitleg: …
Daardoor bedragen de punten voor dit onderdeel XXX op een maximum score van YYY.
(indien van toepassing) Beoordeling van het criterium ‘constructie van de vragenlijst of test’:
De door u aangebrachte artikels met betrekking tot de constructie van het meetinstrument werd beoordeeld op vlak van psychometrische betrouwbaarheid en diverse criteria inzake validiteit.
Beknopte uitleg: …
Daardoor bedragen de punten voor dit onderdeel XXX op een maximum score van YYY.
Beoordeling van het criterium ‘peer reviewed publicaties’.
Op basis van de door u opgestelde tabel en onze controle hierom behaalde u een score van XXX op een maximum score van YYY.
Uw totaal aantal punten op theoretische deugdelijkheid en bewijsvoering bedraagt XXX punten op een maximumscore van YYY.
Wij concluderen op basis van het ingediende dossier dat…
Deze criteria werden opgesteld door Patrick Vermeren – copyright berust bij hem.
U kan de volgende graduele quotering toepassen:
6 meerderheid topexperten[1] noemen de theorie een bewezen ‘theorum’
5 veel convergente bevindingen uit verschillende wetenschapsdomeinen
4 high level (meta)theorie: een brede verklaring voor een fenomeen
3 mid range theorie: een verklaring voor een bepaald fenomeen
2 low level (mini)theorie: verklaart een klein deelaspect van een fenomeen
1 theorie op basis van redeneren en logica/afgeleid van andere theorieën
0 er is geen theorie
-1 methodologisch fout: ‘dustbowl’ of ‘rainforest’ empiricism/anecdotes
-2 de theorie werd door academici verworpen of verlaten of staat haaks op valide/rationele theorieën
-3 de theorie legt niets uit of is niet testbaar of men weigert ze te laten testen
-4 theorie staat haaks op de bevindingen uit de fysica, biologie of chemie
-5 vorige + maar men wil een impressie van wetenschappelijkheid wekken
-6 men onttrekt zich met excuses aan de wetenschappelijke methode
Aan deze gradatie kunt u gewichten toekennen – dit is belangrijk van uit juridisch standpunt voor de motivatie van uw beslissingen. In de sociale wetenschappen zijn vele ondeugdelijke theorieën, dus dit moet het grootste gewicht krijgen, bijvoorbeeld 120 punten (bij een score 6 kent u 120 punten toe).
4 geconfirmeerd in systematische review(s), bij voorkeur kwantitatieve reviews
3 onafhankelijk replicatieonderzoek bevestigt de resultaten
2 eigen replicatieonderzoek bevestigt de resultaten
1 de methode deugt maar er is nog maar één studie; er is nog onderzoek nodig
0 er zijn nog geen empirische bevestigingen
-1 de gebruikte methoden zijn gebrekkig of niet adequaat
-2 de evidentie is negatief of de vragenlijst is ondeugdelijk
-3 meerdere studies verwerpen de theorie of de hypotheses
-4 systematische reviews verwerpen de theorie of de theorie werd ondertussen ingetrokken
Aan deze gradatie kunt u gewichten toekennen – dit is belangrijk van uit juridisch standpunt voor de motivatie van uw beslissingen. U kan bijvoorbeeld 80 punten toekennen - een score van +4 komt overeen met 80 punten.
Statistische betrouwbaarheid: meet de test of vragenlijst adequaat, zonder al te grote foutenmarge? Kan de meting herhaald worden met in grote mate hetzelfde resultaat? Opgelet: een goede betrouwbaarheid kan niet ingeroepen worden als bewijs voor de theorie.· sub: interne consistentie (interne betrouwbaarheid) van de schalen: Alle correlaties tussen de items in een construct (concept, schaal) worden weergegeven. De meeste gebruikte methode is het berekenen van Cronbach’s alpha. Een minimumstandaard op schaalniveau is 0.70; 0.80 is een zeer grote interne consistentie.
· sub: test-hertest betrouwbaarheid: in welke mate geeft de test of vragenlijst hetzelfde resultaat wanneer de test een tweede keer wordt afgenomen 4 tot 8 weken later? Correlaties dienen minimum 0.70 te bedragen, vanaf 0.80 is heel betrouwbaar. · sub: split half betrouwbaarheid: in dit geval wordt de test in twee geplitst: de resultaten van beide afnames moeten hoge correlaties vertonen. · sub: parallelle betrouwbaarheid: twee testen of vragenlijsten worden ontwikkeld die allebei hetzelfde concept zouden moeten meten. De resultaten van beide lijsten moeten hoge correlaties vertonen (> 0.40) |
Construct of concept validiteit: meet de test werkelijk wat de theorie beweert? Een validiteitscoëfficiënt kan nooit hoger uitvallen dan een betrouwbaarheidscoëfficiënt.
· sub: convergente validiteit: vertoont de test of vragenlijst correlaties met andere meetinstrumenten waarmee hij volgens de theorie zou moeten correleren (maar toch een ander construct meet – indien het om hetzelfde construct gaat moet u kijken naar concurrent validiteit (zie criterium validiteit). o sub: congruente validiteit: meten twee instrumenten exact hetzelfde construct? · sub: discriminante validiteit: zijn de constructen (schalen) voldoende gedifferentieerd van elkaar (ze moeten dus zo weinig mogelijk correlatie vertonen met de andere schalen ; de correlaties moeten nul of erg laag zijn) of verschillend van andere constructen die niet door deze vragenlijst worden gemeten (bijvoorbeeld een intelligentietest meet iets anders dan de een persoonlijkheidsvragenlijst over zes grote karaktertrekken) |
Inhoudsvaliditeit: dit is een niet-statistisch type validiteit: experten beoordelen op een systematische manier of de items (vragen, stellingen…) een voldoende representatief staal vormen voor het domein dat zij bevragen. De items zouden het construct volledig moeten afdekken.
· sub: representatie validiteit: werd het construct wel ‘geoperationaliseerd’/’vertaald’ naar observeerbare metingen? · sub: face validity: opgelet, dit wordt wetenschappelijk niet aanvaard als een validiteitscriterium: dit gaat over het aspect of mensen zich ‘op het eerste zicht’ herkennen in de items. Daarom wordt het ook vaak false/faith validity genoemd. het risico op het Forer-effect is aanwezig (mensen aanvaarden het resultaat omdat ze denken dat het uitgaat van een autoriteit of betrouwbaar instrument). |
Criterium validiteit: dit geeft een aanwijzing of de meting consistent is met wat reeds bekend is over het fenomeen.
· sub: concurrent validiteit: vertonen de resultaten van dit (nieuwe) meetinstrument voldoende grote correlatie met de resultaten uit reeds aanvaarde meetinstrumenten? Een correlatiecoëfficient van 0.50 is het minimum om te verwachten. · sub: predictieve validiteit: kan het meetinstrument iets voorspellen – met name dat wat men wou voorspellen? Bijvoorbeeld: in welke mate voorspelt deze intelligentietest toekomstige werkprestaties. o sub: incrementele validiteit: dit is niet echt een maatstaf van validiteit, maar dit cijfer drukt uit in welke mate de resultaten van een meeetinstrument informatie of voorspelbaarheid kan toevoegen bovenop een andere test of vrangelijst (bijvoorbeeld: hoeveel voegt consciëntieusheid toe bovenop intelligentie in het voorspellen van toekomstige werkprestaties). |
Interne validiteit: werd het onderzoeksopzet (research design) uitgevoerd op een zorgvuldige en strikte manier? Werden ook alternatieve verklaringen in overweging genomen (of niet – in dat geval is er misschien confirmatieneiging). Werden andere variabelen bekeken?… |
Externe validiteit: zijn de resultaten van deze studie generaliseerbaar (bijvoorbeeld naar andere populaties)? Waarom? Wat met mogelijke bias en fouten? |
Ecologische validiteit: is het onderzoek wel representatief voor de ‘echte’ wereld – bijvoorbeeld: zullen de resultaten in een laboratoriumsetting herhaald worden in de echte wereld? |
Aan hoe meer van deze criteria correct wordt beantwoord, hoe meer punten u kan toekennen. U kunt bijvoorbeeld volgende maximale gewichtsverdeling toekennen:
Dit levert een maximum puntentotaal op van 82 punten.
Bijkomende bemerkingen:
Of artikels rond de theoretische deugdelijkheid, empirische bevindingen of psychometrische kwaliteiten zijn verschenen in peer-reviewed tijdschriften verwijzen wij in eerste instantie naar de lijst van tijdschriften met peer review zoals opgenomen op de website www.ecoom.be; Ecoom is het Vlaams Expertisecentrum Onderzoek en OntwikkelingsMonitoring. Dit expertisecentrum garandeert een objectieve beoordeling.
De enige peer reviewed journals zijn A1, A2 en A3 publicaties.
A1-publicaties:
Deze A1-publicaties kunnen ook een verschillend gewicht krijgen, naargelang de impactfactor. Het toekennen van een gewicht is een methode die wordt toegepast voor de financiering van de Belgische universiteiten. De universiteiten gebruiken de ISI impact factor van Thomson Reuters, maar dit is betalend. Bij het vermelden van de impactfactor dient de toekennende organisatie te worden vermeld (bijvoorbeeld de impactfactor van ThomsonReuters, Scimago Lab…). In het vakgebied psychologie zijn duizenden tijdschriften, maar niet allen hebben een even goede reputatie.
Naam Tijdschrift | Impactfactor volgens/ ranking in domein
Beoordelend orgaan: YYY |
Rangschikking | Gewicht |
Top 10% binnen het vakgebied | 10 | ||
Volgende 15% | 8 | ||
Volgende 35% | 6 | ||
Volgende 20% | 4 | ||
Laatste 20% | 2 |
Enkele voorbeelden: Impactfactoren van tijdschriften binnen het domein Applied Psychology
Naam Tijdschrift | Impactfactor volgens/ ranking in domein
Beoordelingsorgaan: Thomson-Reuters |
Rangschikking | Gewicht |
Journal Management
Journal of Applied Psychology
Personnel Psychology |
6,071 ISI impact factor 2014
binnen domein ‘applied psychology’: 1/76
4,799 ISI impact factor 2014
binnen domein ‘applied psychology’: 2/76
4,49 ISI impact factor 2014
binnen domein ‘applied psychology’: 4/76
|
Top 10% binnen het vakgebied (91-100%) | 10 |
Volgende 15% (77-90%) | 8 | ||
Personnel Psychology | 0,921 ISI impact factor 2014
binnen domein ‘applied psychology’: 45/76 |
Volgende 35% (41-75%) | 6 |
Volgende 20% (21-40%) | 4 | ||
Gedrag & Organisatie | 0,375 ISI impact factor 2014
binnen domein ‘applied psychology’: 69/76 |
Laatste 20% | 2 |
A2-publicatie:
A3-publicatie: Artikel in een nationaal tijdschrift met peer review, dat niet inbegrepen is in (A1) of (A2)
A4-publicatie: Artikel in een tijdschrift niet inbegrepen in (A1), (A2) of (A3) (noot: zonder peer review)
B = books of boeken
B1-publicatie: wetenschappelijk boek als auteur of co-auteur, geen (doctorale) dissertaties of conferentie-abstracts.
B2-publicatie: Hoofdstuk in een wetenschappelijk boek als auteur of co-auteur, geen conferentie proceedings (zie P)
B3-publicatie: Boekeditor of co-editor, inclusief conference proceedings (zie hierna).
P = Proceedings
P1-publicatie: Proceedings zijn een collectie academische artikels die gepubliceerd werden binnen de context van een academische conferentie en die werden opgenomen in één van de ISI Web of Science databanken (zie hiervoor); het kan gaan om artikels, review articles, proceedings paper, maar ze zijn niet onder de rubriek A1 opgenomen.
C = conference
C1-publicatie: Artikels in proceedings van wetenschappelijke congressen, die niet inbegrepen zijn in (A1) of (A2) of (A3) of (P1) (volledige artikels met uitsluiting van abstracts, ongepubliceerde lezingen, posters, …)
C3-publicatie: Conference – meeting abstract, ongepubliceerde lezingen, posters,…
D = dissertation
D1-publicatie: Doctoraatsverhandeling (valt ook soms onder C2)
V = Varia
V-publicatie: Alle andere publicaties zoals kranten- of magazineartikels, bibliografieën, biografisch items, boekbesprekingen, correcties, redactionele artikels, tentoonstellingsbesprekingen, lemmata, rapporten, tekstedities, theaterbesprekingen, enz.
[1] Deze hebben publicaties in topjournals in hun vakgebied.