Vrednotenje sposobnosti velikih jezikovnih modelov z nalogami strojnega učenja v času sklepanja