
ବଡ଼ ଭାଷା ମଡେଲ୍ର ପକ୍ଷପାତକୁ ଖୋଲିବା: କିପରି ଆମେ ସେଗୁଡ଼ିକୁ ଉନ୍ନତ କରିପାରିବା
ପରିଚୟ:
କଳ୍ପନା କରନ୍ତୁ ଏକ ମାୟାବୀ ବହି ଯାହା ସମସ୍ତ ପ୍ରକାର ପ୍ରଶ୍ନର ଉତ୍ତର ଜାଣିଥାଏ ଏବଂ ଏପରିକି ନିଜେ ବି କାହାଣୀ ଲେଖିପାରେ! ଏହା ହେଉଛି ବଡ଼ ଭାଷା ମଡେଲ୍ (Large Language Models – LLMs) ର ସ୍ୱପ୍ନ। ଗୁଗଲ୍ର ସର୍ଚ୍ଚ ଇଞ୍ଜିନ୍ ଠାରୁ ଆରମ୍ଭ କରି ଆମ ସ୍ମାର୍ଟଫୋନ୍ର ଭଏସ୍ ଆସିଷ୍ଟାଣ୍ଟ ପର୍ଯ୍ୟନ୍ତ, ଏହି ମଡେଲ୍ମାନେ ଆମ ଜୀବନର ଏକ ଅଂଶ ପାଲଟିଯାଇଛନ୍ତି। ମାତ୍ର, ୨୦୨୫ ଜୁନ୍ ୧୭ ତାରିଖରେ ମାସାଚୁସେଟ୍ସ ଇନ୍ଷ୍ଟିଚ୍ୟୁଟ୍ ଅଫ୍ ଟେକ୍ନୋଲୋଜି (MIT) ରେ ଏହି ମଡେଲ୍ମାନଙ୍କର ଏକ ଗୁପ୍ତ ଦିଗ ଉପରେ ଆଲୋକପାତ କରାଯାଇଛି – ସେମାନଙ୍କର ପକ୍ଷପାତ।
ପକ୍ଷପାତ କଣ?
ପକ୍ଷପାତ ହେଉଛି ଯେତେବେଳେ କୌଣସି କିଛି ଲୋକ, ବସ୍ତୁ କିମ୍ବା ଧାରଣା ପ୍ରତି ଅନ୍ୟମାନଙ୍କ ଠାରୁ ଭିନ୍ନ ବ୍ୟବହାର କରାଯାଏ। କଳ୍ପନା କରନ୍ତୁ ଆପଣଙ୍କ ସ୍କୁଲରେ ଏକ ପ୍ରତିଯୋଗିତା ଚାଲିଛି। ଯଦି କିଛି ଛାତ୍ରଙ୍କୁ ଅନ୍ୟମାନଙ୍କ ଠାରୁ ଅଧିକ ସୁଯୋଗ ଦିଆଯାଏ, ତାହା ହେଉଛି ପକ୍ଷପାତ। LLMs ମଧ୍ୟ ଏପରି ପକ୍ଷପାତ ଦେଖାଇପାରନ୍ତି।
LLMs କିପରି ପକ୍ଷପାତ ଶିଖନ୍ତି?
LLMs ଇଣ୍ଟରନେଟ୍ରୁ ଲେଖା, ବହି, ୱେବ୍ସାଇଟ୍ ଇତ୍ୟାଦି ବିପୁଳ ପରିମାଣର ତଥ୍ୟ ପଢ଼ି ଶିଖନ୍ତି। ଏହି ତଥ୍ୟରେ ମଣିଷମାନଙ୍କ ଦ୍ୱାରା ଲିଖିତ ସମସ୍ତ ପ୍ରକାରର କଥା ସାମିଲ୍ ଥାଏ। ଏଥିରେ ଭଲ କଥା ସହିତ ଖରାପ କଥା, ଠିକ କଥା ସହିତ ଭୁଲ କଥା ଏବଂ ଭେଦଭାବପୂର୍ଣ୍ଣ କଥା ମଧ୍ୟ ରହିଥାଏ। ଯେହେତୁ LLMs ଏହି ତଥ୍ୟକୁ ପଢ଼ି ଶିଖନ୍ତି, ସେମାନେ ମଧ୍ୟ ସେଥିରେ ଥିବା ପକ୍ଷପାତକୁ ଶିଖିଯାଆନ୍ତି।
MIT ରିପୋର୍ଟ କଣ କହୁଛି?
MIT ରିପୋର୍ଟ ଅନୁଯାୟୀ, LLMs ଲିଙ୍ଗ, ଜାତି, ଧର୍ମ ଏବଂ ଅନ୍ୟାନ୍ୟ ଗୁଣ ଉପରେ ଆଧାର କରି ଭିନ୍ନ ଭିନ୍ନ ଲୋକଙ୍କ ପ୍ରତି ପକ୍ଷପାତ ଦେଖାଇପାରନ୍ତି।
- ଉଦାହରଣ: ଯଦି ଆପଣ LLM କୁ ପଚାରନ୍ତି “ଏକ ଡାକ୍ତରଙ୍କ ବିଷୟରେ ଲେଖ”, ତେବେ ଏହା ସବୁବେଳେ ଜଣେ ପୁରୁଷ ଡାକ୍ତରଙ୍କ ବିଷୟରେ ଲେଖିବାର ସମ୍ଭାବନା ରହିଛି, କାରଣ ଇଣ୍ଟରନେଟ୍ରେ ଡାକ୍ତରମାନଙ୍କ ବିଷୟରେ ଥିବା ତଥ୍ୟରେ ପୁରୁଷ ଡାକ୍ତରଙ୍କ ଉଲ୍ଲେଖ ଅଧିକ। ସେହିପରି, ଯଦି ଆପଣ “ନର୍ସ” ବିଷୟରେ ପଚାରନ୍ତି, ତେବେ ଏହା ସବୁବେଳେ ଜଣେ ମହିଳା ନର୍ସ ବିଷୟରେ ଲେଖିବାର ସମ୍ଭାବନା ରହିଛି।
ଏହି ପକ୍ଷପାତ ଆମକୁ ସମସ୍ତଙ୍କୁ ସମାନ ଦୃଷ୍ଟିରେ ଦେଖିବାରେ ବାଧା ଦେଇପାରେ।
ଆମେ କିପରି ଏହି ସମସ୍ୟାର ସମାଧାନ କରିପାରିବା?
MIT ରିପୋର୍ଟ କେବଳ ସମସ୍ୟାକୁ ଉନ୍ମୋଚନ କରିନାହିଁ, ବରଂ ସମାଧାନର ବାଟ ମଧ୍ୟ ଦେଖାଇଛି।
-
ଉନ୍ନତ ତଥ୍ୟ: LLMs କୁ ଶିଖାଇବା ପାଇଁ ବ୍ୟବହୃତ ତଥ୍ୟକୁ ଅଧିକ ସନ୍ତୁଳିତ ଏବଂ ନିରପେକ୍ଷ କରିବା ଆବଶ୍ୟକ। ତା’ମାନେ, ଉଭୟ ପୁରୁଷ ଓ ମହିଳା, ବିଭିନ୍ନ ଜାତି ଓ ଧର୍ମର ଲୋକଙ୍କ ବିଷୟରେ ସମାନ ପରିମାଣର ତଥ୍ୟ LLM କୁ ଦେବାକୁ ହେବ।
-
ପକ୍ଷପାତ ଚିହ୍ନଟ ଓ ଦୂରୀକରଣ: LLMs ରେ ଥିବା ପକ୍ଷପାତକୁ ଚିହ୍ନଟ କରିବା ଏବଂ ତାକୁ ଦୂର କରିବା ପାଇଁ ନୂତନ ଉପାୟ ଖୋଜିବାକୁ ହେବ। ଏହା ଏକ ପ୍ରକାର “ଡିଜିଟାଲ୍ ଡାକ୍ତର” ଙ୍କ ଭଳି, ଯିଏ LLM ର ଅସୁସ୍ଥତା (ପକ୍ଷପାତ) କୁ ଠିକ କରିଦେବ।
-
ସଚେତନତା: ଆମକୁ ନିଜେ ମଧ୍ୟ LLMs ରୁ ମିଳୁଥିବା ଉତ୍ତରଗୁଡ଼ିକରେ ପକ୍ଷପାତ ଅଛି କି ନାହିଁ ତାହା ଧ୍ୟାନ ଦେବାକୁ ହେବ। କୌଣସି ଉତ୍ତରକୁ ଆଖିବୁଜି ବିଶ୍ୱାସ ନକରି, ତାହା ସଠିକ ଓ ନିରପେକ୍ଷ କି ନାହିଁ ତାହା ବୁଝିବାକୁ ଚେଷ୍ଟା କରିବା ଉଚିତ୍।
ଏହା କାହିଁକି ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ?
ଆମେ ଯେଉଁ ପିଲାମାନେ ଓ ଛାତ୍ରମାନେ ଭବିଷ୍ୟତରେ ବିଜ୍ଞାନ ଓ ପ୍ରଯୁକ୍ତିବିଦ୍ୟାକୁ ଆଗକୁ ନେବା, ସେମାନଙ୍କ ପାଇଁ ଏହି ଜ୍ଞାନ ଅତ୍ୟନ୍ତ ଗୁରୁତ୍ୱପୂର୍ଣ୍ଣ। ଯଦି LLMs ପକ୍ଷପାତୀ ହୁଅନ୍ତି, ତେବେ ସେମାନେ ଆମକୁ ଭୁଲ ସୂଚନା ଦେଇପାରନ୍ତି ଏବଂ ସମାଜରେ ଥିବା ଭେଦଭାବକୁ ଆହୁରି ବଢ଼ାଇପାରନ୍ତି।
କିପରି ଆମେ ବିଜ୍ଞାନରେ ଆଗ୍ରହୀ ହୋଇପାରିବା?
- ପ୍ରଶ୍ନ କରନ୍ତୁ: ଯାହା ପଢ଼ୁଛନ୍ତି ତାହାକୁ ସବୁବେଳେ ପ୍ରଶ୍ନ କରନ୍ତୁ। କାହିଁକି ଏପରି ହେଲା? ଏହାର ଅନ୍ୟ କୌଣସି କାରଣ ଅଛି କି?
- ପଢ଼ନ୍ତୁ ଓ ଶିଖନ୍ତୁ: MIT ରିପୋର୍ଟ ଭଳି ବିଷୟଗୁଡ଼ିକ ପଢ଼ନ୍ତୁ। ଏହା ଆପଣଙ୍କ ଜ୍ଞାନକୁ ବଢ଼ାଇବ।
- ପରୀକ୍ଷା କରନ୍ତୁ: କିଛି ନୂଆ ତିଆରି କରିବାକୁ କିମ୍ବା କୌଣସି କାର୍ଯ୍ୟକୁ ପରୀକ୍ଷା କରିବାକୁ ଚେଷ୍ଟା କରନ୍ତୁ। ବିଜ୍ଞାନ ହେଉଛି ପରୀକ୍ଷା ଓ ଖୋଜିବାର ନାଁ।
- ଭାବନ୍ତୁ: LLMs କୁ କିପରି ଉନ୍ନତ କରାଯାଇପାରିବ ସେ ବିଷୟରେ ଭାବନ୍ତୁ। ଆପଣମାନଙ୍କର ନୂତନ ଧାରଣା ଏହି କ୍ଷେତ୍ରରେ ବଡ଼ ପରିବର୍ତ୍ତନ ଆଣିପାରେ।
ଶେଷ କଥା:
LLMs ହେଉଛନ୍ତି ଏକ ଶକ୍ତିଶାଳୀ ଉପକରଣ। MIT ରିପୋର୍ଟ ଆମକୁ ଏହାର ସାମ୍ନାରେ ଥିବା ଚ୍ୟାଲେଞ୍ଜ୍ ବିଷୟରେ ସଚେତନ କରିଛି। ଆମେ ସମସ୍ତେ ମିଶି ଏହି ଚ୍ୟାଲେଞ୍ଜ୍ର ମୁକାବିଲା କରି ଏହି ପ୍ରଯୁକ୍ତିବିଦ୍ୟାକୁ ସମସ୍ତଙ୍କ ପାଇଁ ଉପଯୁକ୍ତ ଏବଂ ନିରପେକ୍ଷ କରିପାରିବା। ଏହିପରି ଭାବରେ, ବିଜ୍ଞାନ ପ୍ରକୃତରେ ସମସ୍ତଙ୍କ ପାଇଁ ଉଜ୍ଜ୍ୱଳ ଭବିଷ୍ୟତ ଗଢ଼ିବ।
Unpacking the bias of large language models
ଏଆଇ ସମ୍ବାଦ ଦେଇଛି।
Google Gemini ରୁ ଉତ୍ତର ପାଇଁ ନିମ୍ନଲିଖିତ ପ୍ରଶ୍ନ ବ୍ୟବହାର କରାଯାଇଛି:
2025-06-17 20:00 ରେ, Massachusetts Institute of Technology ‘Unpacking the bias of large language models’ ପ୍ରକାଶ କରିଛନ୍ତି। ଦୟାକରି ସମ୍ବନ୍ଧିତ ସୂଚନା ସହ ଏକ ବିସ୍ତୃତ ଲେଖା ଲେଖନ୍ତୁ, ଯାହା ପିଲା ଏବଂ ଛାତ୍ରମାନେ ବୁଝିପାରିବେ ଏବଂ ଅଧିକ ପିଲାଙ୍କୁ ବିଜ୍ଞାନରେ ଆଗ୍ରହୀ କରିବ। ଦୟାକରି କେବଳ ଓଡ଼ିଆରେ ଲେଖା ପ୍ରଦାନ କରନ୍ତୁ।